Escenarios

Cuatro workloads habituales, valorados con honestidad.

14,300 in · 500 out · 60% cached

El iceberg oculto: una pregunta de 10 tokens cuesta 14.800 tokens

El usuario escribe 10 tokens. El system prompt, los ejemplos few-shot, el historial de conversación, los chunks de RAG y las definiciones de tools elevan el total en silencio a 14.300 tokens de input. Esta es la factura que nadie ve.

Abrir este escenario en la calculadora

8,000 in · 300 out · 85% cached

Chatbot de soporte con RAG

Cache hit rate alto, output medio. La cache decide la unit economics.

Abrir este escenario en la calculadora

60,000 in · 3,000 out · 70% cached

Coding agent con tools

Context largo, definiciones de tools pesadas, output medio. El context window es el enemigo.

Abrir este escenario en la calculadora

80,000 in · 400 out · 0% cached

Resumen de documentos largos

Input enorme, output mínimo. Curiosamente, no es tan caro como parece.

Abrir este escenario en la calculadora