L'iceberg caché : une question de 10 tokens en coûte 14 800
L'utilisateur tape 10 tokens. Le system prompt, les exemples few-shot, l'historique de conversation, les chunks RAG et les définitions de tools portent silencieusement le total à 14 300 tokens d'input. C'est la facture que personne ne voit.
Input
14,300 tokens
Output
500 tokens
Cached
60%
Appels / mois
50,000
Ce qu'il y a dans l'input
L'utilisateur a écrit 10 tokens. Tout le reste a été ajouté en silence.
System prompt800
Exemples few-shot1,500
Historique de conversation4,000
Documents RAG6,000
Définitions de tools2,000
Message utilisateur10
Total14,310 tokens
L'utilisateur a écrit une phrase. Vous avez payé 14 800 tokens. Sans mesure, pas d'optimisation.