Сценарии
Четыре типичных нагрузки — честно посчитанные.
14,300 in · 500 out · 60% cached
Скрытый айсберг: вопрос на 10 токенов стоит 14 800 токенов
Пользователь пишет 10 токенов. Системный промпт, few-shot примеры, история переписки, RAG-чанки и определения tools тихо доводят сумму до 14 300 input-токенов. Это счёт, который никто не видит.
Открыть этот сценарий в калькуляторе
8,000 in · 300 out · 85% cached
RAG-чатбот для поддержки
Высокий процент попаданий в кэш, средний output. Кэш определяет unit-экономику.
Открыть этот сценарий в калькуляторе
60,000 in · 3,000 out · 70% cached
Coding-агент с tools
Длинный контекст, тяжёлые определения tools, средний output. Контекстное окно — главный враг.
Открыть этот сценарий в калькуляторе
80,000 in · 400 out · 0% cached
Суммаризация длинных документов
Огромный input, крошечный output. Парадоксально не так дорого, как кажется.
Открыть этот сценарий в калькуляторе