シナリオ
よくある 4 つのワークロードを、正直に値付けしました。
14,300 in · 500 out · 60% cached
隠れた氷山: 10 トークンの質問が 14,800 トークンに化ける
ユーザーが入力したのは 10 トークン。しかしシステムプロンプト、Few-shot 例、会話履歴、RAG チャンク、ツール定義が静かに加わり、入力は 14,300 トークンに膨らみます。これが誰も見ていない請求書です。
このシナリオを計算機で開く
8,000 in · 300 out · 85% cached
RAG カスタマーサポート chatbot
高いキャッシュヒット率と中程度の出力。ユニットエコノミクスを決めるのはキャッシュです。
このシナリオを計算機で開く
60,000 in · 3,000 out · 70% cached
ツールを使う coding agent
長いコンテキスト、重いツール定義、中程度の出力。コンテキストウィンドウこそが敵です。
このシナリオを計算機で開く
80,000 in · 400 out · 0% cached
長文ドキュメント要約
巨大な入力、わずかな出力。直感に反して、見た目ほど高くはなりません。
このシナリオを計算機で開く