媒体机器之心2026/02/15 19:065940
AdaReasoner提出一种创新的训练范式,使7B小模型在多模态推理任务中实现性能飞跃,甚至在特定拼图推理任务上超越GPT-5。其核心在于将“何时、何种、如何使用工具”作为一种通用推理能力进行学习,而非简单调用。通过Tool Cold Start(TC)引入错误修正与回溯机制,Tool-GRPO(TG)优化多轮工具编排,以及Adaptive Learni…
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 4 篇文章。
AdaReasoner提出一种创新的训练范式,使7B小模型在多模态推理任务中实现性能飞跃,甚至在特定拼图推理任务上超越GPT-5。其核心在于将“何时、何种、如何使用工具”作为一种通用推理能力进行学习,而非简单调用。通过Tool Cold Start(TC)引入错误修正与回溯机制,Tool-GRPO(TG)优化多轮工具编排,以及Adaptive Learni…
本文阐述了 AI 代理与沙箱的两种集成架构:① 代理在沙箱内部运行,适合环境耦合紧密但需重新构建镜像;② 沙箱作为远程工具,便于快速迭代并提升密钥安全。以开源框架 DeepAgents 为例,提供了 pip 安装、代码示例以及实践建议,帮助开发者根据安全、性能和迭代需求选型。
本期播客探讨了2026年AI领域多个核心议题,包括LLMs、扩展定律、智能体、AGI及中国AI发展。内容深入分析技术趋势与研究进展,为开发者和研究者提供有价值的参考。
DeepSeek发布一周年,回顾其带来的技术突破与行业影响。LLMs、Transformer、RAGs和Agents等技术显著进步,提升了AI的学习与应用能力,为各领域带来变革。文章展望未来AI发展,强调技术持续创新的重要性。