专题:model_optimization

按该标签聚合的大模型资讯列表(自动分类与标签提取)。17 篇文章。

媒体Latent Space2026/03/31 09:046830
AI工程师角色持续演变
多智能体协作成为趋势

本文分析了后AI时代职场角色的变化,涵盖AI工程师角色演变、多智能体协作、开源工具生态、本地推理技术及模型优化等趋势。重点讨论了AI在企业组织架构和团队协作中的影响,并列举了Claude Code、Hermes Agent和Qwen3.5-Omni等具体产品,为开发者和研究人员提供有价值的参考。

媒体ByteByteGo Newsletter2026/03/30 23:336820
统一模型处理256种语言对
MoE机制提升翻译效率

Roblox利用AI技术实现100毫秒内16种语言实时翻译,采用统一Transformer架构与MoE机制,结合知识蒸馏、量化和缓存优化,提升效率与质量。尽管面临低资源语言对的挑战,其技术实践展示了AI在多语言翻译中的潜力。

媒体InfoQ 中文2026/03/26 18:107830
优化上下文窗口管理技术
提升长文本处理效率

苹果优化其基础语言模型的上下文窗口管理技术,提升长文本处理效率和性能。通过减少内存占用和加快推理速度,该技术适用于Siri等AI产品,为移动设备上的自然语言处理提供新方案。核心亮点包括模型压缩和分块处理的创新。

媒体InfoQ 中文2026/03/17 01:265830
模型与硬件协同优化提升推理效率
量化与剪枝是关键优化手段

本文聚焦AI 2.0时代大模型推理优化,探讨模型与硬件协同设计的策略。通过模型压缩、量化、剪枝和硬件加速等方法,提升推理效率和资源利用率。文章提供了实际案例和实验结果,强调了协同优化在实际部署中的重要性。

媒体AINews2026/03/13 13:446830
MCP工具在确定性API中仍具重要价值
Chrome v146支持Web MCP,推动连续代理发展

MCP工具在确定性API中仍具价值,Chrome v146支持Web MCP,推动连续浏览代理发展。IBM提升持久内存性能,多代理记忆成为挑战。Anthropic Opus 4.6支持100万令牌处理,DeepSeek的稀疏注意力优化提升模型效率。

媒体AINews2026/03/11 13:447930
Nemotron 3 Super参数量达1200亿
推理速度比GPT-OSS-120B快2.2倍

NVIDIA发布Nemotron 3 Super,参数量达1200亿,采用混合架构,推理速度提升2.2倍,支持代理式工作负载。该模型在AA Intelligence Index中表现优异,同时推动了代理系统的应用与优化,涵盖多个AI产品和平台。

媒体Lobsters AI2026/03/11 04:126840
无需调整参数提升模型性能
分析LLM神经架构优化方法

本文介绍了一种无需调整模型参数即可提升大型语言模型在AI排行榜表现的方法。通过深入分析模型的神经架构,作者提出了一种创新的训练或优化策略,展示了如何在不改变权重的情况下实现性能突破。核心亮点在于对模型结构的利用和实验验证。

媒体Gino Notes2026/03/03 08:004720
从怀疑到实践:AI工具的使用进阶路径
强调数据质量与模型迭代的重要性

Mitchell Hashimoto分享了自己从AI怀疑论者到熟练使用者的进阶过程,强调在真实项目中对AI工具的合理使用方法和经验教训。文章提供了实用的实践指南,涵盖AI评估、数据质量、模型优化等核心主题,适合开发者参考。