시나리오
흔한 워크로드 네 가지를 솔직하게 가격 매겼어요.
14,300 in · 500 out · 60% cached
숨은 빙산: 10 토큰짜리 질문이 14,800 토큰이 되는 이유
사용자는 10 토큰을 입력했어요. 시스템 프롬프트, few-shot 예시, 대화 기록, RAG 청크, 툴 정의가 조용히 더해져 입력이 14,300 토큰까지 불어나요. 아무도 보지 않는 청구서가 바로 이거예요.
이 시나리오를 계산기에서 열기
8,000 in · 300 out · 85% cached
RAG 고객 지원 chatbot
높은 캐시 적중률에 중간 수준의 출력. 유닛 이코노믹스를 결정짓는 건 결국 캐시예요.
이 시나리오를 계산기에서 열기
60,000 in · 3,000 out · 70% cached
툴을 쓰는 coding agent
긴 컨텍스트, 무거운 툴 정의, 중간 수준의 출력. 진짜 적은 컨텍스트 윈도우입니다.
이 시나리오를 계산기에서 열기
80,000 in · 400 out · 0% cached
긴 문서 요약
거대한 입력에 아주 작은 출력. 의외로 보이는 만큼 비싸지 않아요.
이 시나리오를 계산기에서 열기