可用阿里云聊天
qwen3-32b

构建基于 qwen3-32b 的下一代应用

API 代码示例

价格

TokenLab 价格

$0.112

每 Token

折扣: 30%

一键测试

登录后,Web Agent 会保留这个模型、提示词和请求预设。

在 Web Agent 中使用 /v1/chat/completions 测试 qwen3-32b,然后展示请求体、延迟和响应。

API 工作台

生产默认路线。下方代码示例会按你选择的格式使用这个端点。

chat兼容 OpenAI
POST/v1/chat/completions
curl https://api.tokenlab.sh/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{
    "model": "qwen3-32b",
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

应用场景

01

智能体与工具

用于推理、客服分流、工具调用和多步任务流程。

02

开发流程

在不动现有架构的前提下,做代码生成、评审或调试。

03

知识助手

上线聊天、搜索与检索流程,成本和行为都可预期。

04

同台对比

在确定为生产默认模型前,先看真实的响应质量、延迟和价格。

提示词示例

写一段简洁的客服回复,并列出背后的假设。

审查这个 API 设计,指出前三个接入风险。

把一份长更新日志整理成非工程师也看得懂的发布说明。

费用计算器

1M
0.5M
预估月度费用$0.34

常见问题

qwen3-32b 的费用是多少?

在 TokenLab 上,qwen3-32b 输入 $0.1120/1M tokens,输出 $0.4480/1M tokens。如适用,缓存和按次价格会在上方价格表中列出。

qwen3-32b 适合做什么?

qwen3-32b 适合 工具调用, JSON 模式。可以通过 TokenLab 用同一个 API key 直接调用。

如何调用 qwen3-32b API?

在 TokenLab 获取 API key 后,向 https://api.tokenlab.sh/v1/chat/completions 发请求即可。上方 API 工作台已提供推荐端点和可直接复制的代码示例。

qwen3-32b 应该使用哪个端点?

qwen3-32b 默认使用 https://api.tokenlab.sh/v1/chat/completions。如果模型支持原生格式,API 工作台会同时给出原生端点。

接入前可以先测试 qwen3-32b 吗?

可以。「在 Web Agent 中试用」会为 qwen3-32b 打开一个预填好的测试,登录后提示词不会丢,可以接着跑。

相关模型