可用阿里云聊天⚡缓存 98% 优惠

qwen3-max

构建基于 qwen3-max 的下一代应用

价格

TokenLab 价格

$1.48

每 Token

折扣: 30%

	官方价格	TokenLab 价格	折扣
输入	$2.11	$1.48	30%
输出	$8.43	$5.90	30%

Prompt 缓存价格

缓存读取

$0.046

$0.0322

30%

一键测试

登录后，Web Agent 会保留这个模型、提示词和请求预设。

在 Web Agent 中使用 /v1/chat/completions 测试 qwen3-max，然后展示请求体、延迟和响应。

API 工作台

生产默认路线。下方代码示例会按你选择的格式使用这个端点。

chat兼容 OpenAI

POST/v1/chat/completions

curl https://api.tokenlab.sh/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{
    "model": "qwen3-max",
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

应用场景

适合场景

推理

多步推理、分析与研究类工作流

智能体与工具

用于推理、客服分流、工具调用和多步任务流程。

开发流程

在不动现有架构的前提下，做代码生成、评审或调试。

知识助手

上线聊天、搜索与检索流程，成本和行为都可预期。

同台对比

在确定为生产默认模型前，先看真实的响应质量、延迟和价格。

提示词示例

写一段简洁的客服回复，并列出背后的假设。

审查这个 API 设计，指出前三个接入风险。

把一份长更新日志整理成非工程师也看得懂的发布说明。

费用计算器

每月输入 Token 数1M

每月输出 Token 数0.5M

预估月度费用$4.43

常见问题

qwen3-max 的费用是多少？

在 TokenLab 上，qwen3-max 输入 $1.4770/1M tokens，输出 $5.9010/1M tokens。如适用，缓存和按次价格会在上方价格表中列出。

qwen3-max 适合做什么？

qwen3-max 适合推理, 工具调用, JSON 模式。可以通过 TokenLab 用同一个 API key 直接调用。

如何调用 qwen3-max API？

在 TokenLab 获取 API key 后，向 https://api.tokenlab.sh/v1/chat/completions 发请求即可。上方 API 工作台已提供推荐端点和可直接复制的代码示例。

qwen3-max 应该使用哪个端点？

qwen3-max 默认使用 https://api.tokenlab.sh/v1/chat/completions。如果模型支持原生格式，API 工作台会同时给出原生端点。

接入前可以先测试 qwen3-max 吗？

可以。「在 Web Agent 中试用」会为 qwen3-max 打开一个预填好的测试，登录后提示词不会丢，可以接着跑。