AI economy

O custo real dos LLMs, não só $/M tokens.

A maioria das páginas de preço esconde o que de fato move sua fatura: output custa 3–5× mais que input, cached input é quase de graça e contexto longo queima dinheiro em silêncio. Esta página, não.

Abrir calculadora Comparar modelos

Model Context Protocol

Use a partir do seu assistente de IA.

Mesmo dataset, mesmas tools — chamáveis a partir do Claude Desktop, Cursor, Claude Code ou qualquer cliente compatível com MCP. Cole uma URL na sua config. Sem instalação, sem auth, grátis.

Veja como funciona

{
  "mcpServers": {
    "ai-pricing": {
      "url": "https://aieconomylab.com/mcp"
    }
  }
}

Quatro lentes que as páginas de preço pulam

Assimetria entre input e output

Tokens de output custam 3–5× mais que input em todos os grandes provedores. Quase nenhum orçamento considera isso.

Cached input

Prompt caching derruba system prompts repetidos para ~10% do custo normal. Times grandes pagam preço cheio porque ninguém mediu.

Armadilha da janela de contexto

Contexto maior = custo maior, resposta mais lenta e qualidade pior (lost-in-the-middle). Uma janela de 2M é ferramenta, não feature.

Tokenização por idioma

Prompts em turco consomem 30–40% mais tokens do que em inglês, dependendo do tokenizer. Em árabe são 50%+ a mais. Seus usuários não-anglófonos custam mais caro.

Stay ahead of the bill.

Get the AI Economy Playbook 2026 (free, 47-page PDF) plus the monthly Token Economy Index — model price changes, vendor moves, real cost benchmarks. No spam.

We'll only send the monthly index. Unsubscribe anytime.