Scenari

Quattro workload comuni, prezzati con onestà.

14,300 in · 500 out · 60% cached

L'iceberg nascosto: una domanda da 10 token costa 14.800 token

L'utente scrive 10 token. System prompt, esempi few-shot, cronologia della conversazione, chunk RAG e definizioni dei tool portano silenziosamente il totale a 14.300 token di input. Questa è la fattura che nessuno vede.

Apri questo scenario nel calcolatore

8,000 in · 300 out · 85% cached

Chatbot di supporto clienti RAG

Cache hit rate alto, output medio. È la cache a fare la unit economics.

Apri questo scenario nel calcolatore

60,000 in · 3,000 out · 70% cached

Coding agent con tools

Context lungo, definizioni di tool pesanti, output medio. Il context window è il nemico.

Apri questo scenario nel calcolatore

80,000 in · 400 out · 0% cached

Riassunto di documenti lunghi

Input enorme, output minuscolo. Controintuitivamente, non costa quanto sembra.

Apri questo scenario nel calcolatore