专题:cost-efficiency

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

媒体AINews2026/03/18 13:445720
MiniMax M2.7:具备自我进化能力的SOTA模型,成本仅为GLM-5的1/3
小米MiMo-V2-Pro:专注API推理,token使用效率显著提升

MiniMax M2.7是具备自我进化能力的SOTA开源模型,在SWE-Pro和Terminal Bench 2任务中分别达到56.22%和57.0%的性能表现。其核心优势在于:1)智能指数50分与GLM-5持平,但成本仅为1/3;2)通过递归机制持续优化技能与架构;3)支持Ollama Cloud等平台部署。小米MiMo-V2-Pro和Cartesia …

官方Microsoft Azure Blog2026/03/05 01:007830
Azure IaaS支持AI、全球应用和关键业务系统
提供弹性扩展与多层安全防护

Azure IaaS资源中心是支持现代云基础设施设计、优化和运营的集中平台,强调性能、安全性、弹性扩展和成本效率。它为AI工作负载、全球应用和关键业务系统提供全面支持,帮助组织在数字化转型中保持创新与稳定。

媒体AINews2026/03/03 13:447660
Gemini 3.1 Flash-Lite性能提升显著
GPT-5.3 Instant优化对话与幻觉

谷歌DeepMind发布Gemini 3.1 Flash-Lite,提升效率与多模态处理能力;OpenAI推出GPT-5.3 Instant,优化对话自然度与减少幻觉;Qwen因人员变动面临发展不确定性。文章聚焦AI模型的性能提升、产品更新及组织变化,反映行业技术与生态的动态演进。

媒体量子位2026/02/20 09:258750

Google 于 2026 年 2 月推出 Gemini 3.1 Pro,基于 Gemini 3 Pro 进行大幅升级:推理能力提升约 2 倍,支持 1 M token 长上下文,增强多模态生成与代码推理,并在保持原有计费的前提下实现约 10 倍成本下降。该模型已在 Gemini 应用、API 与 NotebookLM 中开放,适用于复杂可视化、长文档推理…

媒体AINews2026/02/13 13:447840

MiniMax-M2.5 是一款基于 Forge 强化学习框架的开源大模型,专为编码和工具调用设计。其在 SWE-Bench 测试中表现优异,通过率80.2%,成本低至每小时1美元。支持多种量化格式,便于部署,同时具备高计算资源利用率和多级前缀缓存机制,提升了代理的稳定性和执行效率。