Cenários
Quatro cargas de trabalho comuns, precificadas com honestidade.
14,300 in · 500 out · 60% cached
O iceberg invisível: uma pergunta de 10 tokens custa 14.800 tokens
O usuário digita 10 tokens. System prompt, exemplos few-shot, histórico da conversa, chunks de RAG e definições de tools elevam silenciosamente o total para 14.300 tokens de input. Esta é a fatura que ninguém vê.
Abrir este cenário na calculadora
8,000 in · 300 out · 85% cached
Chatbot RAG de atendimento ao cliente
Alta taxa de cache hit, output médio. O cache faz ou destrói a unit economics.
Abrir este cenário na calculadora
60,000 in · 3,000 out · 70% cached
Coding agent com tools
Contexto longo, definições de tools pesadas, output médio. A janela de contexto é a inimiga.
Abrir este cenário na calculadora
80,000 in · 400 out · 0% cached
Sumarização de documentos longos
Input gigante, output minúsculo. Contraintuitivamente, não é tão caro quanto parece.
Abrir este cenário na calculadora