AI economy
Il costo reale degli LLM, non solo $/M tokens.
La maggior parte delle pagine prezzi nasconde ciò che davvero muove la fattura: l'output costa 3–5× l'input, il cached input è quasi gratis, il context lungo brucia soldi in silenzio. Qui no.
Model Context Protocol
Usalo dal tuo assistente AI.
Stesso dataset, stessi tools — richiamabili da Claude Desktop, Cursor, Claude Code o qualsiasi client compatibile con MCP. Incolla un URL nella tua config. Niente installazione, niente auth, gratis.
Guarda come funziona{
"mcpServers": {
"ai-pricing": {
"url": "https://aieconomylab.com/mcp"
}
}
} Quattro angoli che le pagine prezzi saltano
Asimmetria input vs output
I token di output costano 3–5× quelli di input presso ogni grande provider. Quasi nessun budget ne tiene conto.
Cached input
Il prompt caching abbatte i system prompt ripetuti al ~10% del costo normale. Molti team pagano prezzo pieno perché nessuno ha misurato.
Trappola del context window
Context più lungo = costo più alto, risposte più lente, qualità peggiore (lost-in-the-middle). Una finestra da 2M è uno strumento, non un pregio.
Tokenizzazione per lingua
Un prompt in turco consuma il 30–40% di token in più rispetto all'inglese, a seconda del tokenizer. L'arabo: 50%+. I tuoi utenti non anglofoni costano di più.
Stay ahead of the bill.
Get the AI Economy Playbook 2026 (free, 47-page PDF) plus the monthly Token Economy Index — model price changes, vendor moves, real cost benchmarks. No spam.
We'll only send the monthly index. Unsubscribe anytime.