可用阿里云聊天⚡缓存 98% 优惠
qwen3-max
构建基于 qwen3-max 的下一代应用
价格
TokenLab 价格
$1.48
折扣: 30%
| 官方价格 | TokenLab 价格 | 折扣 | |
|---|---|---|---|
| 输入 | $2.11 | $1.48 | 30% |
| 输出 | $8.43 | $5.90 | 30% |
Prompt 缓存价格
| 缓存读取 | $0.046 | $0.0322 | 30% |
一键测试
登录后,Web Agent 会保留这个模型、提示词和请求预设。
在 Web Agent 中使用 /v1/chat/completions 测试 qwen3-max,然后展示请求体、延迟和响应。
API 工作台
生产默认路线。下方代码示例会按你选择的格式使用这个端点。
chat兼容 OpenAI
POST/v1/chat/completions
curl https://api.tokenlab.sh/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model": "qwen3-max",
"messages": [
{"role": "user", "content": "Hello!"}
]
}'应用场景
适合场景推理
多步推理、分析与研究类工作流
01
智能体与工具
用于推理、客服分流、工具调用和多步任务流程。
02
开发流程
在不动现有架构的前提下,做代码生成、评审或调试。
03
知识助手
上线聊天、搜索与检索流程,成本和行为都可预期。
04
同台对比
在确定为生产默认模型前,先看真实的响应质量、延迟和价格。
提示词示例
写一段简洁的客服回复,并列出背后的假设。
审查这个 API 设计,指出前三个接入风险。
把一份长更新日志整理成非工程师也看得懂的发布说明。
费用计算器
1M
0.5M
预估月度费用$4.43
常见问题
qwen3-max 的费用是多少?
在 TokenLab 上,qwen3-max 输入 $1.4770/1M tokens,输出 $5.9010/1M tokens。如适用,缓存和按次价格会在上方价格表中列出。
qwen3-max 适合做什么?
qwen3-max 适合 推理, 工具调用, JSON 模式。可以通过 TokenLab 用同一个 API key 直接调用。
如何调用 qwen3-max API?
在 TokenLab 获取 API key 后,向 https://api.tokenlab.sh/v1/chat/completions 发请求即可。上方 API 工作台已提供推荐端点和可直接复制的代码示例。
qwen3-max 应该使用哪个端点?
qwen3-max 默认使用 https://api.tokenlab.sh/v1/chat/completions。如果模型支持原生格式,API 工作台会同时给出原生端点。
接入前可以先测试 qwen3-max 吗?
可以。「在 Web Agent 中试用」会为 qwen3-max 打开一个预填好的测试,登录后提示词不会丢,可以接着跑。