Escenarios
Cuatro workloads habituales, valorados con honestidad.
14,300 in · 500 out · 60% cached
El iceberg oculto: una pregunta de 10 tokens cuesta 14.800 tokens
El usuario escribe 10 tokens. El system prompt, los ejemplos few-shot, el historial de conversación, los chunks de RAG y las definiciones de tools elevan el total en silencio a 14.300 tokens de input. Esta es la factura que nadie ve.
Abrir este escenario en la calculadora
8,000 in · 300 out · 85% cached
Chatbot de soporte con RAG
Cache hit rate alto, output medio. La cache decide la unit economics.
Abrir este escenario en la calculadora
60,000 in · 3,000 out · 70% cached
Coding agent con tools
Context largo, definiciones de tools pesadas, output medio. El context window es el enemigo.
Abrir este escenario en la calculadora
80,000 in · 400 out · 0% cached
Resumen de documentos largos
Input enorme, output mínimo. Curiosamente, no es tan caro como parece.
Abrir este escenario en la calculadora