专题:workers-ai

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体The Cloudflare Blog2026/03/20 03:536940
Workers AI上线Kimi K2.5大模型,支持256k上下文
新增前缀缓存与会话亲和性提升推理效率

Cloudflare在Workers AI上上线Kimi K2.5大模型,支持256k上下文与多模态输入,专为智能代理优化。通过定制推理栈、前缀缓存与会话亲和性等技术,实现边缘高效推理。实际应用中,代码审查成本降低77%,Agents SDK已默认集成,推动AI代理在边缘端规模化落地。