专题：token-efficiency

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 4 篇文章。

MiniMax M2.7：成本仅为GLM-5三分之一的SOTA开源智能体模型

媒体AINews2026/03/18 13:445720

• MiniMax M2.7：具备自我进化能力的SOTA模型，成本仅为GLM-5的1/3

• 小米MiMo-V2-Pro：专注API推理，token使用效率显著提升

MiniMax M2.7是具备自我进化能力的SOTA开源模型，在SWE-Pro和Terminal Bench 2任务中分别达到56.22%和57.0%的性能表现。其核心优势在于：1）智能指数50分与GLM-5持平，但成本仅为1/3；2）通过递归机制持续优化技能与架构；3）支持Ollama Cloud等平台部署。小米MiMo-V2-Pro和Cartesia …

AI模型模型优化技术多代理协作 Model Context Protocol（MCP）成本效率

多AI模型更新与技术进展：Claude Opus、Qwen 3.5、GLM-5及Gemini 3.1 Pro

原文

媒体AINews2026/02/18 13:447830

• Claude Opus/Sonnet 4.6智能指数提升

• Qwen 3.5开源并优化推理效率

多款AI模型更新，包括Claude Opus/Sonnet 4.6、Qwen 3.5、GLM-5及Gemini 3.1 Pro。重点在于智能指数提升、推理效率优化、开源模型权重及社区表现。技术报告和讨论揭示了模型在自主性、训练成本和性能上的进展。

LLM模型自主智能体基准测试检索增强生成推理速度

符号简写语法：提升LLM指令效率的非语言化探索

原文

社区Reddit r/LocalLLaMA2026/02/16 08:256820

本文提出一种基于Unicode块字符的符号简写语法，用于提升大型语言模型的指令效率。通过非语言化表达任务状态、层级和优先级，该方法显著减少冗余并增强零样本理解能力。初步测试显示其在token效率和上下文稳定性方面表现优异，具有较高的技术创新性和研究价值。

符号简写 LLM注意力机制输出token效率非语言指令宏语言

OpenAI与Anthropic AI大模型竞争升级：GPT-5.3 Codex与Claude Opus 4.6新突破

原文

媒体AINews2026/02/05 13:447830

OpenAI发布GPT-5.3 Codex，提升推理速度和令牌效率；Anthropic展示Claude Opus 4.6在编译器构建和长上下文处理上的突破。两者均在智能体平台和实际应用上取得进展，预示AI模型运行效率的提升。

GPT-5.3-Codex Claude Opus 4.6 输出token效率 Agent平台长上下文处理