AI economy
Biaya nyata LLM, bukan sekadar $/M tokens.
Sebagian besar halaman harga menyembunyikan hal-hal yang sebenarnya menggerakkan tagihan: output 3–5× lebih mahal dari input, cached input nyaris gratis, dan context panjang membakar uang diam-diam. Halaman ini tidak menyembunyikannya.
Model Context Protocol
Pakai langsung dari AI assistant Anda.
Dataset yang sama, tool yang sama — bisa dipanggil dari Claude Desktop, Cursor, Claude Code, atau client apa pun yang mendukung MCP. Cukup tempel satu URL ke config Anda. Tanpa install, tanpa auth, gratis.
Lihat cara kerjanya{
"mcpServers": {
"ai-pricing": {
"url": "https://aieconomylab.com/mcp"
}
}
} Empat sudut yang dilewatkan kebanyakan halaman harga
Asimetri input vs output
Token output berharga 3–5× input di setiap penyedia besar. Sebagian besar anggaran mengabaikan ini.
Cached input
Prompt caching menurunkan biaya system prompt yang berulang menjadi ~10% dari harga normal. Tim besar membayar harga penuh karena tak ada yang mengukurnya.
Jebakan context window
Context lebih panjang = biaya lebih tinggi, balasan lebih lambat, jawaban lebih buruk (lost-in-the-middle). Window 2M itu alat, bukan fitur.
Tokenisasi bahasa
Prompt bahasa Turki memakai 30–40% lebih banyak token dibanding Inggris, tergantung tokenizer. Bahasa Arab 50%+ lebih banyak. Pengguna non-Inggris Anda lebih mahal.
Stay ahead of the bill.
Get the AI Economy Playbook 2026 (free, 47-page PDF) plus the monthly Token Economy Index — model price changes, vendor moves, real cost benchmarks. No spam.
We'll only send the monthly index. Unsubscribe anytime.