Сценарії
Чотири типові навантаження — чесно прораховані.
14,300 in · 500 out · 60% cached
Прихований айсберг: запитання на 10 токенів коштує 14 800 токенів
Користувач пише 10 токенів. Системний промпт, few-shot приклади, історія розмови, RAG-чанки й визначення tools тихо доводять суму до 14 300 input-токенів. Це рахунок, якого ніхто не бачить.
Відкрити цей сценарій у калькуляторі
8,000 in · 300 out · 85% cached
RAG-чатбот для підтримки
Високий відсоток влучань у кеш, середній output. Кеш визначає unit-економіку.
Відкрити цей сценарій у калькуляторі
60,000 in · 3,000 out · 70% cached
Coding-агент з tools
Довгий контекст, важкі визначення tools, середній output. Контекстне вікно — головний ворог.
Відкрити цей сценарій у калькуляторі
80,000 in · 400 out · 0% cached
Сумаризація довгих документів
Величезний input, крихітний output. Парадоксально не так дорого, як здається.
Відкрити цей сценарій у калькуляторі