阿里发布Qwen3.6-Plus编程大模型,性能接近Claude,具备Vibe Coding、多模态理解及智能体能力。通过多个实测案例展示其在网页开发、3D场景生成和代码重构方面的强大表现,已上线阿里云平台,为开发者提供高效编程工具。
专题:agent
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 78 篇文章。
Meta提出Hyperagents,结合哥德尔机与达尔文算法,实现智能体自我进化与优化。实验显示其在编程任务中性能显著提升,具有跨领域迁移能力,但受限于任务的自指性。该成果对AI研究和开发具有重要参考价值。
OpenAI扩展Responses API,增强自主智能体的构建能力。支持多步骤任务处理和工具调用,提升AI在实际场景中的应用价值。该更新推动智能体技术标准化,为AI生态发展提供基础设施。
本文介绍了一种基于记忆的 DevOps Agent 架构,通过沉淀历史经验实现运维流程的自动化进化。其核心亮点在于记忆模块的设计与技能训练机制,适用于复杂系统的运维优化,具有较高的工程参考价值。
本文围绕OpenClaw(AI Agent)的实战应用与配置方法展开,涵盖自动化流程、法律AI、情感陪伴、记忆管理等多个场景,展示了AI Agent在不同领域的潜力与实现方式,强调了技术配置与评测对提升其效能的关键作用。
本文聚焦AI Agent在生产环境中的可观测性与评估飞轮构建,提出了一套闭环优化方法,强调性能监控、日志分析和用户反馈的重要性,为实际部署提供了可参考的实践方案。
华为盘古大模型负责人王云鹤离职创业,投身Agent领域。他曾在华为诺亚方舟实验室主导多项AI技术研究,包括超分辨率算法和GhostNet,技术成果应用于FAST等重大项目,具有行业影响力。
2026年3月AI动态涵盖H100价格回升、模型优化技术进展、代理产品化、开源框架应用及多模态系统研究,展示了AI基础设施和应用的持续演进。
Uber应用智能体系统实现设计文档自动化,提升效率与一致性。系统结合NLP和ML技术,解析用户需求并生成文档。核心亮点在于自动化流程与实际落地效果。
中国大模型专家在圆桌讨论中聚焦agent技术演进、token使用量激增与算力挑战,强调开源生态、模型结构创新和基础设施优化的重要性,认为未来AI将更偏向agent-native。
本文介绍大规模Agent系统的评估工程实践,强调从盲目调优转向数据驱动方法。通过构建数据收集、指标设计和自动化测试框架,提升Agent性能与决策能力。核心亮点在于实际案例分析和对评估挑战的深入探讨。
Stripe 部署了基于 LLM 的自主智能体 Minions,用于自动化生成拉取请求。该工具显著提升了代码提交效率,展示了 AI 在工程实践中的落地应用。其核心亮点在于自动化分析与生成能力,以及与现有开发流程的无缝集成。
AI Agent技术催生‘首席龙虾官’新职位,涵盖多个行业,薪资高且技术要求明确,推动企业AI化转型。
DeepSeek大规模招聘Agent相关人才,涵盖算法、数据、基础设施等方向,强调AI编程工具使用和产品化落地,布局完整技术闭环,显示其在Agent赛道的深度投入。
本文介绍了一种面向智能体时代的AI人才发展模型,旨在系统化培养和管理AI人才。该模型结合智能体技术特点,强调数据驱动与跨学科素养,适用于AI组织的人才储备与成长路径规划。
本文探讨AI初创企业全球化趋势,邀请多家企业与团队分享出海经验,涵盖产品、技术与增长策略,聚焦AI Agent、脑机接口与空间智能等应用,分析当前AI出海的机遇与挑战。
本文聚焦智能体从原型到生产级服务的工程化实践,分析关键挑战并提出解决方案,涵盖架构设计、性能优化、安全性和可扩展性等核心议题,具有较高的实践参考价值。
黄仁勋认为AGI已实现,强调推理的复杂性,提出OpenClaw是Token时代的iPhone,推动AI商品化。他讨论了数据中心能源优化、AI对职业的影响,以及技术发展与人性价值的关系。
阿里推出海外企业级AI Agent Accio Work,实现30分钟网店搭建。内置多种技能,支持Agent团队协作,提供本地化运营策略和安全机制,降低跨境电商门槛,提升效率。
Claude 3升级GUI操控能力,实现与人类无差别操作电脑。支持传统软件,提供远程控制和定时任务功能,系统兼容性逐步扩展,安全设计完善。用户对功能强大表示惊叹,但担忧token成本。