Scenari
Quattro workload comuni, prezzati con onestà.
14,300 in · 500 out · 60% cached
L'iceberg nascosto: una domanda da 10 token costa 14.800 token
L'utente scrive 10 token. System prompt, esempi few-shot, cronologia della conversazione, chunk RAG e definizioni dei tool portano silenziosamente il totale a 14.300 token di input. Questa è la fattura che nessuno vede.
Apri questo scenario nel calcolatore
8,000 in · 300 out · 85% cached
Chatbot di supporto clienti RAG
Cache hit rate alto, output medio. È la cache a fare la unit economics.
Apri questo scenario nel calcolatore
60,000 in · 3,000 out · 70% cached
Coding agent con tools
Context lungo, definizioni di tool pesanti, output medio. Il context window è il nemico.
Apri questo scenario nel calcolatore
80,000 in · 400 out · 0% cached
Riassunto di documenti lunghi
Input enorme, output minuscolo. Controintuitivamente, non costa quanto sembra.
Apri questo scenario nel calcolatore