estimate_cost किसी workload के लिए per-call, मासिक और सालाना लागत। Input, cached input और output अलग-अलग। भाषा का overhead भी लगता है।
ऐसे पूछ सकते हैं
"gpt-5 को per call 5K input / 1K output, 50% cached, और महीने में 10K calls पर चलाने की मासिक लागत निकालो।"