面试官看了一眼我的 AI 项目架构图,突然停住了。
“你这个 Agent,每次都是调用旗舰模型?”
我点点头:“对啊,肯定得用地表最强的啊,效果好。”
他沉默了两秒,然后开口:“那意图分类、标题生成、JSON 修复、简单摘要,也全走 Opus?”
我开始有点心虚:“主要是为了稳定……”
面试官没说话,等了几秒,又问:“那如果哪天旗舰模型限流了呢?意图分类这种小任务,每个月烧掉的钱你算过吗?”
很多朋友第一次做 AI 应用都会踩这个坑:以为模型越强,系统越稳。实际上,生产环境里真正难的不是“选一个最强模型”,而是根据任务类型、成本、延迟、风险,把不同请求送到合适的模型上。
