DisponibleMetaChat

llama-3.1-8b-instant

Créez des applications nouvelle génération avec llama-3.1-8b-instant

Tarification

Prix TokenLab

$0.035

Par jeton

Remise: 30%

	Prix officiel	Prix TokenLab	Remise
Entrée	$0.05	$0.035	30%
Sortie	$0.08	$0.056	30%

Test en un clic

Après connexion, Web Agent conserve ce modèle, ce prompt et le préréglage de requête pour vous.

Tester llama-3.1-8b-instant dans Web Agent avec une courte requête à /v1/chat/completions, puis montre le corps de requête, la latence et la réponse.

Atelier API

C’est la route par défaut pour la production. L’exemple de code ci-dessous utilise ce point de terminaison avec le format choisi.

chatCompatible OpenAI

POST/v1/chat/completions

curl https://api.tokenlab.sh/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{
    "model": "llama-3.1-8b-instant",
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

Cas d'usage

Agents et outils

Pilotez raisonnement, triage du support, appels d'outils et flux de tâches multi-étapes.

Workflows développeur

Générez, relisez ou déboguez du code sans réorganiser votre stack.

Assistants de connaissance

Mettez en production chat, recherche et retrieval avec coûts et comportement prévisibles.

Comparaison directe

Voyez la qualité de réponse, la latence et le prix réels avant d'en faire votre modèle de production par défaut.

Exemples de prompts

Rédige une réponse support concise et liste les hypothèses derrière.

Relis ce design d'API et signale les trois principaux risques d'intégration.

Transforme un long changelog en notes de version compréhensibles par un non-ingénieur.

Calculateur de coût

Tokens d'entrée mensuels1M

Tokens de sortie mensuels0.5M

Coût mensuel estimé$0.06

FAQ

Combien coûte llama-3.1-8b-instant ?

Sur TokenLab, llama-3.1-8b-instant coûte $0.0350 par 1M de tokens d'entrée et $0.0560 par 1M de tokens de sortie. Les prix de cache et par requête apparaissent dans la table tarifaire si applicable.

À quoi llama-3.1-8b-instant convient-il le mieux ?

llama-3.1-8b-instant est un bon choix pour Utilisation d'outils. Vous pouvez l'appeler via TokenLab avec une seule clé API.

Comment appeler l'API llama-3.1-8b-instant ?

Obtenez une clé API TokenLab, puis envoyez votre requête à https://api.tokenlab.sh/v1/chat/completions. La workbench API ci-dessus propose un endpoint recommandé et du code prêt à copier.

Quel endpoint llama-3.1-8b-instant doit-il utiliser ?

Utilisez https://api.tokenlab.sh/v1/chat/completions par défaut pour llama-3.1-8b-instant. Si un format natif fournisseur est pris en charge, la workbench API affiche aussi cet endpoint.

Puis-je tester llama-3.1-8b-instant avant de l'intégrer ?

Oui. « Tester dans Web Agent » ouvre un test prêt pour llama-3.1-8b-instant et conserve votre prompt après connexion, sans perdre le contexte.

Modèles associés

Grok

xAI · 22 modèles

Doubao

ByteDance · 9 modèles

Alibaba Cloud · 6 modèles

Plus de Meta Parcourir les modèles Chat