今天一整天都在跟 AI agent 打交道,但做的是两件很不同的事:一边在 XX 项目里用 benchmark 驱动 todo 提取质量的提升,一边在 blagent 里让 AI 当产品经理分析需求然后自己实现。 两件事表面没关系,但做完之后发现有个共同的问题贯穿始终:AI 系 ... »
Cloudflare Workers AI 一直给人的印象是跑小模型——快、便宜、够用。但这次他们直接上了 frontier 级别的开源模型,第一个就是 Moonshot 的 Kimi K2.5。 这事挺值得聊的。 为什么是现在? 一个很现实的问题:agent 时代来了, ... »