可用Meta聊天
llama-3.1-8b-instant
構建基於 llama-3.1-8b-instant 的下一代應用
價格
TokenLab 價格
$0.035
折扣: 30%
| 官方價格 | TokenLab 價格 | 折扣 | |
|---|---|---|---|
| 輸入 | $0.05 | $0.035 | 30% |
| 輸出 | $0.08 | $0.056 | 30% |
一鍵測試
登入後,Web Agent 會保留這個模型、提示詞和請求預設。
在 Web Agent 中使用 /v1/chat/completions 測試 llama-3.1-8b-instant,然後展示請求內容、延遲與回應。
API 工作台
生產預設路線。下方程式碼範例會按你選擇的格式使用這個端點。
chat相容 OpenAI
POST/v1/chat/completions
curl https://api.tokenlab.sh/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model": "llama-3.1-8b-instant",
"messages": [
{"role": "user", "content": "Hello!"}
]
}'應用情境
01
智慧代理與工具
用於推理、客服分流、工具呼叫與多步任務流程。
02
開發流程
在不動既有架構的前提下,完成程式碼產生、評審或除錯。
03
知識助理
上線聊天、搜尋與檢索流程,成本與行為都可預期。
04
同台對比
在決定為正式環境預設模型之前,先看一下真實的回應品質、延遲與價格。
提示詞範例
寫一段簡潔的客服回覆,並列出背後的假設。
審閱這個 API 設計,指出前三個接入風險。
把一份長更新日誌整理成非工程師也看得懂的發布說明。
費用計算機
1M
0.5M
預估每月費用$0.06
常見問題
llama-3.1-8b-instant 的費用是多少?
在 TokenLab 上,llama-3.1-8b-instant 輸入 $0.0350/1M tokens,輸出 $0.0560/1M tokens。如適用,快取與按次價格會在上方價格表中列出。
llama-3.1-8b-instant 適合做什麼?
llama-3.1-8b-instant 適合 工具使用。可以透過 TokenLab 用同一把 API key 直接呼叫。
如何呼叫 llama-3.1-8b-instant API?
在 TokenLab 取得 API key 後,向 https://api.tokenlab.sh/v1/chat/completions 發送請求即可。上方 API 工作台已提供推薦端點與可直接複製的程式碼範例。
llama-3.1-8b-instant 應該使用哪一個端點?
llama-3.1-8b-instant 預設使用 https://api.tokenlab.sh/v1/chat/completions。如果模型支援原生格式,API 工作台會同時列出原生端點。
接入前可以先測試 llama-3.1-8b-instant 嗎?
可以。「在 Web Agent 中試用」會為 llama-3.1-8b-instant 開啟一個預先設定好的測試,登入後提示詞不會遺失,可以直接接著跑。