Créez des applications nouvelle génération avec llama-3.1-8b-instant
Tarification
Prix TokenLab
$0.035
Remise: 30%
| Prix officiel | Prix TokenLab | Remise | |
|---|---|---|---|
| Entrée | $0.05 | $0.035 | 30% |
| Sortie | $0.08 | $0.056 | 30% |
Test en un clic
Après connexion, Web Agent conserve ce modèle, ce prompt et le préréglage de requête pour vous.
Tester llama-3.1-8b-instant dans Web Agent avec une courte requête à /v1/chat/completions, puis montre le corps de requête, la latence et la réponse.
Atelier API
C’est la route par défaut pour la production. L’exemple de code ci-dessous utilise ce point de terminaison avec le format choisi.
curl https://api.tokenlab.sh/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model": "llama-3.1-8b-instant",
"messages": [
{"role": "user", "content": "Hello!"}
]
}'Cas d'usage
Agents et outils
Pilotez raisonnement, triage du support, appels d'outils et flux de tâches multi-étapes.
Workflows développeur
Générez, relisez ou déboguez du code sans réorganiser votre stack.
Assistants de connaissance
Mettez en production chat, recherche et retrieval avec coûts et comportement prévisibles.
Comparaison directe
Voyez la qualité de réponse, la latence et le prix réels avant d'en faire votre modèle de production par défaut.
Exemples de prompts
Rédige une réponse support concise et liste les hypothèses derrière.
Relis ce design d'API et signale les trois principaux risques d'intégration.
Transforme un long changelog en notes de version compréhensibles par un non-ingénieur.
Calculateur de coût
FAQ
Combien coûte llama-3.1-8b-instant ?
Sur TokenLab, llama-3.1-8b-instant coûte $0.0350 par 1M de tokens d'entrée et $0.0560 par 1M de tokens de sortie. Les prix de cache et par requête apparaissent dans la table tarifaire si applicable.
À quoi llama-3.1-8b-instant convient-il le mieux ?
llama-3.1-8b-instant est un bon choix pour Utilisation d'outils. Vous pouvez l'appeler via TokenLab avec une seule clé API.
Comment appeler l'API llama-3.1-8b-instant ?
Obtenez une clé API TokenLab, puis envoyez votre requête à https://api.tokenlab.sh/v1/chat/completions. La workbench API ci-dessus propose un endpoint recommandé et du code prêt à copier.
Quel endpoint llama-3.1-8b-instant doit-il utiliser ?
Utilisez https://api.tokenlab.sh/v1/chat/completions par défaut pour llama-3.1-8b-instant. Si un format natif fournisseur est pris en charge, la workbench API affiche aussi cet endpoint.
Puis-je tester llama-3.1-8b-instant avant de l'intégrer ?
Oui. « Tester dans Web Agent » ouvre un test prêt pour llama-3.1-8b-instant et conserve votre prompt après connexion, sans perdre le contexte.