VerfügbarMetaChat

llama-3.1-8b-instant

Erstellen Sie Next-Gen-Apps mit llama-3.1-8b-instant

Preise

TokenLab-Preis

$0.035

Pro Token

Rabatt: 30%

	Offizieller Preis	TokenLab-Preis	Rabatt
Input	$0.05	$0.035	30%
Output	$0.08	$0.056	30%

Ein-Klick-Test

Nach der Anmeldung behält Web Agent dieses Modell, den Prompt und die Anfragevorgabe für Sie bei.

Test llama-3.1-8b-instant im Web Agent mit einer kurzen Anfrage an /v1/chat/completions und zeige dann Request-Body, Latenz und Antwort.

API-Workbench

Dies ist die Standardroute für die Produktion. Das Codebeispiel unten nutzt diesen Endpunkt im ausgewählten Format.

chatOpenAI-kompatibel

POST/v1/chat/completions

curl https://api.tokenlab.sh/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{
    "model": "llama-3.1-8b-instant",
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

Anwendungsfälle

Agenten und Tools

Treiben Sie Reasoning, Support-Triage, Tool-Aufrufe und mehrstufige Aufgabenflüsse an.

Entwickler-Workflows

Code generieren, prüfen oder debuggen, ohne Ihren Stack umzubauen.

Wissensassistenten

Bringen Sie Chat, Suche und Retrieval mit verlässlichen Kosten und Verhalten live.

Direkter Vergleich

Sehen Sie reale Antwortqualität, Latenz und Preis, bevor dies Ihr Produktionsstandard wird.

Prompt-Beispiele

Schreibe eine knappe Support-Antwort und liste die Annahmen dahinter auf.

Prüfe dieses API-Design und nenne die drei größten Integrationsrisiken.

Mach aus einem langen Changelog Release Notes, die ein Nicht-Entwickler liest.

Kostenrechner

Monatliche Input-Tokens1M

Monatliche Output-Tokens0.5M

Geschätzte monatliche Kosten$0.06

FAQ

Was kostet llama-3.1-8b-instant?

Auf TokenLab kostet llama-3.1-8b-instant $0.0350 pro 1M Input-Tokens und $0.0560 pro 1M Output-Tokens. Cache- und Pro-Anfrage-Preise erscheinen, sofern relevant, in der Preistabelle.

Wofür eignet sich llama-3.1-8b-instant am besten?

llama-3.1-8b-instant ist eine starke Wahl für Werkzeugnutzung. Sie können es über TokenLab mit einem einzigen API-Schlüssel aufrufen.

Wie rufe ich die llama-3.1-8b-instant-API auf?

Holen Sie sich einen TokenLab-API-Schlüssel und senden Sie Ihre Anfrage an https://api.tokenlab.sh/v1/chat/completions. Die API-Workbench oben enthält den empfohlenen Endpunkt und kopierfertigen Code.

Welchen Endpunkt soll llama-3.1-8b-instant verwenden?

Verwenden Sie standardmäßig https://api.tokenlab.sh/v1/chat/completions für llama-3.1-8b-instant. Wird ein anbieter-natives Format unterstützt, zeigt die API-Workbench auch diesen Endpunkt.

Kann ich llama-3.1-8b-instant vor der Integration testen?

Ja. „In Web Agent testen“ öffnet einen vorbereiteten Test für llama-3.1-8b-instant und behält Ihren Prompt nach der Anmeldung bei – Ihr Kontext geht nicht verloren.