Chatbot de soporte con RAG
Cache hit rate alto, output medio. La cache decide la unit economics.
Input
8,000 tokens
Output
300 tokens
Cached
85%
Llamadas / mes
200,000
Cache hit rate alto, output medio. La cache decide la unit economics.
Input
8,000 tokens
Output
300 tokens
Cached
85%
Llamadas / mes
200,000