Scénarios
Quatre workloads courants, chiffrés sans tricher.
14,300 in · 500 out · 60% cached
L'iceberg caché : une question de 10 tokens en coûte 14 800
L'utilisateur tape 10 tokens. Le system prompt, les exemples few-shot, l'historique de conversation, les chunks RAG et les définitions de tools portent silencieusement le total à 14 300 tokens d'input. C'est la facture que personne ne voit.
Ouvrir ce scénario dans le calculateur
8,000 in · 300 out · 85% cached
Chatbot de support client RAG
Cache hit rate élevé, output moyen. C'est le cache qui fait ou défait l'unit economics.
Ouvrir ce scénario dans le calculateur
60,000 in · 3,000 out · 70% cached
Coding agent avec tools
Context long, définitions de tools volumineuses, output moyen. Le context window est l'ennemi.
Ouvrir ce scénario dans le calculateur
80,000 in · 400 out · 0% cached
Résumé de documents longs
Input massif, output minuscule. Étonnamment, moins cher qu'il n'en a l'air.
Ouvrir ce scénario dans le calculateur