专题:framework

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

媒体机器之心2026/02/16 10:105830

MoCo 是华盛顿大学等联合推出的开源 Python 框架,统一了 26 种跨四层级的多模型协同算法,支持从 API 级路由到权重级合并的全链路实验。框架提供统一配置、25 套评测基准,并兼容任意数量模型与多 GPU 环境。基于 MoCo 的实验表明,模型数量和多样性均能显著提升系统性能,协同系统还能解决单模型无法完成的任务,展示了组合式 AI 的潜力。

官方Microsoft Research Blog2025/12/12 01:005840

微软亚洲研究院上海分部发布了Agent Lightning开源框架,旨在解决AI代理集成强化学习(RL)的难题。该框架通过将代理执行与RL训练解耦,允许开发者几乎无需修改现有代码即可为LLM代理添加RL能力。它将代理行为标准化为状态-动作序列,并引入分层RL算法LightningRL,显著提升了多步任务的处理效率和准确性。Agent Lightning在文…