Scenariusze
Cztery typowe obciążenia — uczciwie wycenione.
14,300 in · 500 out · 60% cached
Ukryta góra lodowa: pytanie na 10 tokenów kosztuje 14 800 tokenów
Użytkownik pisze 10 tokenów. Systemowy prompt, przykłady few-shot, historia rozmowy, fragmenty RAG i definicje tools po cichu pompują sumę do 14 300 tokenów input. To jest ten rachunek, którego nikt nie widzi.
Otwórz ten scenariusz w kalkulatorze
8,000 in · 300 out · 85% cached
RAG chatbot do obsługi klienta
Wysoki cache hit rate, średni output. Cache decyduje o unit economics.
Otwórz ten scenariusz w kalkulatorze
60,000 in · 3,000 out · 70% cached
Coding agent z tools
Długi kontekst, ciężkie definicje tools, średni output. Okno kontekstu to wróg numer jeden.
Otwórz ten scenariusz w kalkulatorze
80,000 in · 400 out · 0% cached
Streszczanie długich dokumentów
Ogromny input, mikroskopijny output. Wbrew intuicji nie tak drogie, jak wygląda.
Otwórz ten scenariusz w kalkulatorze