Senaryolar
Dört yaygın iş yükü, dürüstçe fiyatlandırılmış.
14,300 in · 500 out · 60% cached
Görünmeyen buzdağı: 10 token'lık soru 14.800 token'a mal oluyor
Kullanıcı 10 token yazar. Sistem promptu, few-shot örnekler, konuşma geçmişi, RAG chunkları ve tool tanımları toplamı sessizce 14.300 input token'a çıkarır. Kimsenin görmediği fatura budur.
Bu senaryoyu hesap makinesinde aç
8,000 in · 300 out · 85% cached
RAG müşteri destek botu
Yüksek cache oranı, orta output. Unit economics'i cache belirler.
Bu senaryoyu hesap makinesinde aç
60,000 in · 3,000 out · 70% cached
Tool kullanan coding agent
Uzun context, ağır tool tanımları, orta output. Context window düşmandır.
Bu senaryoyu hesap makinesinde aç
80,000 in · 400 out · 0% cached
Uzun doküman özetleme
Devasa input, minik output. Göründüğü kadar pahalı değil.
Bu senaryoyu hesap makinesinde aç