专题:model-optimization

按该标签聚合的大模型资讯列表(自动分类与标签提取)。38 篇文章。

媒体AINews2026/04/02 13:445810
Gemma 4 开源 Apache 2.0 权重
支持多模态、函数调用、64k 上下文

Google DeepMind 于 2026 年发布 Gemma 4 系列模型,采用 Apache 2.0 开源许可证,提供 31 B dense、26 B MoE 以及两款面向移动/IoT 的轻量模型。全部模型原生支持文本、视觉、音频多模态,具备函数调用与结构化 JSON 输出,并将上下文窗口提升至 64 k token。性能基准显示 Gemma 4 在…

媒体InfoQ 中文2026/04/01 22:474830
对比LLM架构复杂度差异
分析模块化与极简方案优劣

文章对比Claude Code与OpenClaw两种LLM架构方案,分析复杂度对模型性能的影响。Claude Code采用模块化设计实现功能扩展,但存在参数冗余问题;OpenClaw通过极简架构降低实现难度。重点探讨架构复杂度与模型效率的平衡,提供代码示例和应用场景分析,为LLM开发提供设计思路参考。

官方Engineering at Meta2026/04/01 00:006720
动态调整模型复杂度
优化多GPU基础设施

Meta开发的自适应排名模型通过动态调整模型复杂度,解决LLM级广告推荐系统的推理三难问题。该模型采用请求中心架构、硬件协同设计和多卡基础设施优化,实现亚秒级延迟与高参数规模。在Instagram部署后,广告转化率提升3%,点击率增长5%,为大规模推荐系统提供高效解决方案。

媒体Latent Space2026/03/31 03:257930
Voxtral TTS发布
开源推进AI发展

Mistral推出Voxtral TTS语音合成模型,融合自回归生成与流匹配技术,性能超越ElevenLabs。同时披露Forge编码器、Leanstral轻量化模型及Mistral 4研发方向,强调开源协作与企业应用落地。技术团队通过架构创新提升语音生成准确度与效率,布局AI语音技术全栈发展。

媒体Latent Space2026/03/27 09:357820
CLI工具提升开发者操作效率
语音模型与实时功能更新

多技术平台推出基于CLI的新工具,提升开发者效率。同时,语音模型、实时多模态检索、小型化模型及多代理系统等AI技术取得进展,涵盖基础设施、模型训练与应用优化等多个领域,对AI研究和开发具有重要参考价值。

媒体LangChain Blog2026/03/26 23:186840
构建针对性代理评估体系
定义多维度性能指标

本文提出了一套针对深度代理的评估体系构建方法,强调通过针对性评估优化代理行为。涵盖多个测试类别和指标,如正确性、效率等,并通过开源实现促进社区协作。核心亮点在于评估与实际生产需求的紧密对齐,以及对模型性能的全面度量。

官方Simon Willison2026/03/24 13:097840
流式专家技术实现大模型在低内存设备运行
Qwen3.5-397B-A17B在MacBook Pro成功运行

流式专家技术通过按需加载专家权重,使超大规模语言模型能在内存有限的设备上运行。已实现Qwen3.5-397B-A17B和Kimi K2.5模型在MacBook Pro和iPhone上的运行,处理速度逐步提升。该技术为本地化部署和边缘计算提供了新思路,具有较高的实用价值。

媒体AINews2026/03/23 13:446770
Claude实现桌面应用控制
AI模型自我优化机制出现

本文综述了AI助手功能升级与LLM技术进展,涵盖桌面控制、自我优化、编码自动化、中国模型发展、开源竞争、应用场景及安全挑战。Claude等模型在操作自动化方面取得突破,AI在多个领域提升效率,但性能瓶颈和安全性仍是待解决的问题。

媒体AINews2026/03/19 13:445840
Cursor发布Composer 2模型
OpenAI收购Astral团队

Cursor发布Composer 2编码模型,训练成本降低且通过多项基准测试。OpenAI收购Astral团队强化Python工具链,Anthropic升级Claude Code功能。LangChain推出企业级代理管理平台LangSmith Fleet,聚焦安全与权限控制。AI代理领域加速向集群化管理和运行时机制发展,行业技术演进趋势显著。

媒体AINews2026/03/18 13:445720
MiniMax M2.7:具备自我进化能力的SOTA模型,成本仅为GLM-5的1/3
小米MiMo-V2-Pro:专注API推理,token使用效率显著提升

MiniMax M2.7是具备自我进化能力的SOTA开源模型,在SWE-Pro和Terminal Bench 2任务中分别达到56.22%和57.0%的性能表现。其核心优势在于:1)智能指数50分与GLM-5持平,但成本仅为1/3;2)通过递归机制持续优化技能与架构;3)支持Ollama Cloud等平台部署。小米MiMo-V2-Pro和Cartesia …

官方Engineering at Meta2026/03/18 04:076830
REA 自主管理 ML 实验流程
模型准确率提升 2 倍

Meta 推出排名工程师代理(REA),通过自主 AI 代理加速广告排序模型的 ML 实验流程。REA 能够自主生成假设、管理异步工作流、调试故障并优化模型,显著提升准确率和工程效率。其核心亮点在于自主性、假设多样性与系统稳健性,代表 Meta 在 AI 工程化方向的重要进展。