专题:agent

按该标签聚合的大模型资讯列表(自动分类与标签提取)。78 篇文章。

媒体量子位2026/04/02 15:088910
Qwen3.6-Plus性能对标Claude
支持Vibe Coding与多模态生成

阿里发布Qwen3.6-Plus编程大模型,性能接近Claude,具备Vibe Coding、多模态理解及智能体能力。通过多个实测案例展示其在网页开发、3D场景生成和代码重构方面的强大表现,已上线阿里云平台,为开发者提供高效编程工具。

媒体量子位2026/03/31 12:327950
Hyperagents实现自我进化
DGM性能提升显著

Meta提出Hyperagents,结合哥德尔机与达尔文算法,实现智能体自我进化与优化。实验显示其在编程任务中性能显著提升,具有跨领域迁移能力,但受限于任务的自指性。该成果对AI研究和开发具有重要参考价值。

媒体InfoQ 中文2026/03/30 19:566840
基于记忆的 DevOps Agent 架构
从经验中学习并优化运维流程

本文介绍了一种基于记忆的 DevOps Agent 架构,通过沉淀历史经验实现运维流程的自动化进化。其核心亮点在于记忆模块的设计与技能训练机制,适用于复杂系统的运维优化,具有较高的工程参考价值。

媒体量子位2026/03/30 11:497800
AI Agent实战应用案例
配置与评测方法解析

本文围绕OpenClaw(AI Agent)的实战应用与配置方法展开,涵盖自动化流程、法律AI、情感陪伴、记忆管理等多个场景,展示了AI Agent在不同领域的潜力与实现方式,强调了技术配置与评测对提升其效能的关键作用。

媒体量子位2026/03/27 22:286840
中国大模型团队优势在于算力受限下的最优解能力
token使用量暴增推动基础设施升级

中国大模型专家在圆桌讨论中聚焦agent技术演进、token使用量激增与算力挑战,强调开源生态、模型结构创新和基础设施优化的重要性,认为未来AI将更偏向agent-native。

媒体InfoQ 中文2026/03/27 18:525820
评估方法从调优转向数据驱动
构建自动化测试与反馈机制

本文介绍大规模Agent系统的评估工程实践,强调从盲目调优转向数据驱动方法。通过构建数据收集、指标设计和自动化测试框架,提升Agent性能与决策能力。核心亮点在于实际案例分析和对评估挑战的深入探讨。

媒体InfoQ 中文2026/03/26 18:006840
Stripe 使用 LLM 自动生成 PR
Minions 提高代码提交效率

Stripe 部署了基于 LLM 的自主智能体 Minions,用于自动化生成拉取请求。该工具显著提升了代码提交效率,展示了 AI 在工程实践中的落地应用。其核心亮点在于自动化分析与生成能力,以及与现有开发流程的无缝集成。

媒体量子位2026/03/24 16:548760
AGI已实现,推理比预训练更难
OpenClaw是Token时代的iPhone

黄仁勋认为AGI已实现,强调推理的复杂性,提出OpenClaw是Token时代的iPhone,推动AI商品化。他讨论了数据中心能源优化、AI对职业的影响,以及技术发展与人性价值的关系。