媒体The Cloudflare Blog2026/03/20 03:536940
• Workers AI上线Kimi K2.5大模型,支持256k上下文
• 新增前缀缓存与会话亲和性提升推理效率
Cloudflare在Workers AI上上线Kimi K2.5大模型,支持256k上下文与多模态输入,专为智能代理优化。通过定制推理栈、前缀缓存与会话亲和性等技术,实现边缘高效推理。实际应用中,代码审查成本降低77%,Agents SDK已默认集成,推动AI代理在边缘端规模化落地。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 3 篇文章。
Cloudflare在Workers AI上上线Kimi K2.5大模型,支持256k上下文与多模态输入,专为智能代理优化。通过定制推理栈、前缀缓存与会话亲和性等技术,实现边缘高效推理。实际应用中,代码审查成本降低77%,Agents SDK已默认集成,推动AI代理在边缘端规模化落地。
阿里云Coding Plan新增支持多款编程模型,提供高性价比订阅服务,降低AI编码成本。新用户可享受首月低价优惠,支持自由切换模型,适用于复杂任务处理场景。平台已上线100多款主流模型及400多个Agent模板,助力开发者高效应用AI技术。
本文作者对比评测了 Kimi K2.5 和 Opus 在编码任务上的表现。在构建一个 Next.js 地球查看器应用时,Kimi K2.5 在初始构建阶段表现接近,但需要更多文件修改和修复时间;而在添加身份验证、PostHog 集成等复杂功能时,Opus 表现出更强的端到端处理能力和稳定性,Kimi K2.5 则遇到了困难。尽管如此,作者认为 Kimi K…