Erstellen Sie Next-Gen-Apps mit llama-3.1-8b-instant
Preise
TokenLab-Preis
$0.035
Rabatt: 30%
| Offizieller Preis | TokenLab-Preis | Rabatt | |
|---|---|---|---|
| Input | $0.05 | $0.035 | 30% |
| Output | $0.08 | $0.056 | 30% |
Ein-Klick-Test
Nach der Anmeldung behält Web Agent dieses Modell, den Prompt und die Anfragevorgabe für Sie bei.
Test llama-3.1-8b-instant im Web Agent mit einer kurzen Anfrage an /v1/chat/completions und zeige dann Request-Body, Latenz und Antwort.
API-Workbench
Dies ist die Standardroute für die Produktion. Das Codebeispiel unten nutzt diesen Endpunkt im ausgewählten Format.
curl https://api.tokenlab.sh/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model": "llama-3.1-8b-instant",
"messages": [
{"role": "user", "content": "Hello!"}
]
}'Anwendungsfälle
Agenten und Tools
Treiben Sie Reasoning, Support-Triage, Tool-Aufrufe und mehrstufige Aufgabenflüsse an.
Entwickler-Workflows
Code generieren, prüfen oder debuggen, ohne Ihren Stack umzubauen.
Wissensassistenten
Bringen Sie Chat, Suche und Retrieval mit verlässlichen Kosten und Verhalten live.
Direkter Vergleich
Sehen Sie reale Antwortqualität, Latenz und Preis, bevor dies Ihr Produktionsstandard wird.
Prompt-Beispiele
Schreibe eine knappe Support-Antwort und liste die Annahmen dahinter auf.
Prüfe dieses API-Design und nenne die drei größten Integrationsrisiken.
Mach aus einem langen Changelog Release Notes, die ein Nicht-Entwickler liest.
Kostenrechner
FAQ
Was kostet llama-3.1-8b-instant?
Auf TokenLab kostet llama-3.1-8b-instant $0.0350 pro 1M Input-Tokens und $0.0560 pro 1M Output-Tokens. Cache- und Pro-Anfrage-Preise erscheinen, sofern relevant, in der Preistabelle.
Wofür eignet sich llama-3.1-8b-instant am besten?
llama-3.1-8b-instant ist eine starke Wahl für Werkzeugnutzung. Sie können es über TokenLab mit einem einzigen API-Schlüssel aufrufen.
Wie rufe ich die llama-3.1-8b-instant-API auf?
Holen Sie sich einen TokenLab-API-Schlüssel und senden Sie Ihre Anfrage an https://api.tokenlab.sh/v1/chat/completions. Die API-Workbench oben enthält den empfohlenen Endpunkt und kopierfertigen Code.
Welchen Endpunkt soll llama-3.1-8b-instant verwenden?
Verwenden Sie standardmäßig https://api.tokenlab.sh/v1/chat/completions für llama-3.1-8b-instant. Wird ein anbieter-natives Format unterstützt, zeigt die API-Workbench auch diesen Endpunkt.
Kann ich llama-3.1-8b-instant vor der Integration testen?
Ja. „In Web Agent testen“ öffnet einen vorbereiteten Test für llama-3.1-8b-instant und behält Ihren Prompt nach der Anmeldung bei – Ihr Kontext geht nicht verloren.