Scenariusze

Cztery typowe obciążenia — uczciwie wycenione.

14,300 in · 500 out · 60% cached

Ukryta góra lodowa: pytanie na 10 tokenów kosztuje 14 800 tokenów

Użytkownik pisze 10 tokenów. Systemowy prompt, przykłady few-shot, historia rozmowy, fragmenty RAG i definicje tools po cichu pompują sumę do 14 300 tokenów input. To jest ten rachunek, którego nikt nie widzi.

Otwórz ten scenariusz w kalkulatorze

8,000 in · 300 out · 85% cached

RAG chatbot do obsługi klienta

Wysoki cache hit rate, średni output. Cache decyduje o unit economics.

Otwórz ten scenariusz w kalkulatorze

60,000 in · 3,000 out · 70% cached

Coding agent z tools

Długi kontekst, ciężkie definicje tools, średni output. Okno kontekstu to wróg numer jeden.

Otwórz ten scenariusz w kalkulatorze

80,000 in · 400 out · 0% cached

Streszczanie długich dokumentów

Ogromny input, mikroskopijny output. Wbrew intuicji nie tak drogie, jak wygląda.

Otwórz ten scenariusz w kalkulatorze