AI economy

Il costo reale degli LLM, non solo $/M tokens.

La maggior parte delle pagine prezzi nasconde ciò che davvero muove la fattura: l'output costa 3–5× l'input, il cached input è quasi gratis, il context lungo brucia soldi in silenzio. Qui no.

Apri il calcolatore Confronta i modelli

Model Context Protocol

Usalo dal tuo assistente AI.

Stesso dataset, stessi tools — richiamabili da Claude Desktop, Cursor, Claude Code o qualsiasi client compatibile con MCP. Incolla un URL nella tua config. Niente installazione, niente auth, gratis.

Guarda come funziona

{
  "mcpServers": {
    "ai-pricing": {
      "url": "https://aieconomylab.com/mcp"
    }
  }
}

Quattro angoli che le pagine prezzi saltano

Asimmetria input vs output

I token di output costano 3–5× quelli di input presso ogni grande provider. Quasi nessun budget ne tiene conto.

Cached input

Il prompt caching abbatte i system prompt ripetuti al ~10% del costo normale. Molti team pagano prezzo pieno perché nessuno ha misurato.

Trappola del context window

Context più lungo = costo più alto, risposte più lente, qualità peggiore (lost-in-the-middle). Una finestra da 2M è uno strumento, non un pregio.

Tokenizzazione per lingua

Un prompt in turco consuma il 30–40% di token in più rispetto all'inglese, a seconda del tokenizer. L'arabo: 50%+. I tuoi utenti non anglofoni costano di più.

Stay ahead of the bill.

Get the AI Economy Playbook 2026 (free, 47-page PDF) plus the monthly Token Economy Index — model price changes, vendor moves, real cost benchmarks. No spam.

We'll only send the monthly index. Unsubscribe anytime.