专题:optimization

按该标签聚合的大模型资讯列表(自动分类与标签提取)。8 篇文章。

媒体InfoQ 中文2026/03/27 18:525820
评估方法从调优转向数据驱动
构建自动化测试与反馈机制

本文介绍大规模Agent系统的评估工程实践,强调从盲目调优转向数据驱动方法。通过构建数据收集、指标设计和自动化测试框架,提升Agent性能与决策能力。核心亮点在于实际案例分析和对评估挑战的深入探讨。

社区Reddit r/LocalLLaMA2026/02/12 19:3730

EMAS是一个开源项目,它创新性地将遗传算法应用于大型语言模型(LLM)智能体团队的优化。该系统通过构建拥有不同推理策略的智能体团队,并运行进化循环(包括选择、交叉和变异),以迭代方式发现最佳响应。项目旨在超越单一LLM的局限,提升多智能体协作的效率和效果。作者选择Rust语言实现,以其强大的并发管理能力,有效处理数十个智能体并发调用的复杂场景。EMAS为…