Scenario's
Vier veelvoorkomende workloads, eerlijk doorgerekend.
14,300 in · 500 out · 60% cached
De verborgen ijsberg: een vraag van 10 tokens kost 14.800 tokens
De gebruiker typt 10 tokens. System prompt, few-shot voorbeelden, gespreksgeschiedenis, RAG-chunks en tool-definities tillen het totaal stilletjes naar 14.300 input-tokens. Dit is de rekening die niemand ziet.
Open dit scenario in de calculator
8,000 in · 300 out · 85% cached
RAG-chatbot voor klantenservice
Hoge cache hit rate, gemiddelde output. De cache bepaalt de unit economics.
Open dit scenario in de calculator
60,000 in · 3,000 out · 70% cached
Coding agent met tools
Lang context, zware tool-definities, gemiddelde output. Het context window is de vijand.
Open dit scenario in de calculator
80,000 in · 400 out · 0% cached
Samenvatten van lange documenten
Enorme input, minuscule output. Tegen de verwachting in: lang niet zo duur als het lijkt.
Open dit scenario in de calculator