首页/详情

美团发布 LongCat-Flash-Thinking-2601,工具调用能力登顶开源模型

美团技术团队2026/01/20 08:00机翻/自动摘要/自动分类
5 阅读

内容评分

技术含量
8/10
营销水分
7/10

摘要

美团发布 LongCat-Flash-Thinking-2601,该模型在 Agentic Search、Agentic Tool Use 和 TIR 等关键指标上达到开源模型 SOTA 水平,具备强大的工具调用与智能体协作能力,适用于复杂任务处理与 AI 研究。

正文

美团 LongCat 团队近日正式发布了 LongCat-Flash-Thinking-2601 模型,作为其前代模型的升级版本,该模型在多个关键评估指标上表现突出,包括搜索(Agentic Search)、工具调用(Agentic Tool Use)以及工具交互推理(Tool Interaction Reasoning, TIR)。这些指标直接反映了模型在处理复杂任务时的推理能力和与外部工具的协作效率。据官方介绍,LongCat-Flash-Thinking-2601 在这些评测基准上达到了开源模型中的最佳水平(SOTA),表明其在构建高效、智能的 AI 方面具有显著优势。该模型的发布不仅展示了美团在领域的持续投入,也为开发者和研究者提供了更强大的工具支持。

标签