专题：self-attention

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

Mistral发布Voxtral TTS等创新成果，探讨Mistral 4技术演进

媒体Latent Space2026/03/31 03:257930

• Voxtral TTS发布

• 开源推进AI发展

Mistral推出Voxtral TTS语音合成模型，融合自回归生成与流匹配技术，性能超越ElevenLabs。同时披露Forge编码器、Leanstral轻量化模型及Mistral 4研发方向，强调开源协作与企业应用落地。技术团队通过架构创新提升语音生成准确度与效率，布局AI语音技术全栈发展。

社区Hacker News2026/03/23 09:063830

• 解析Transformer核心组件

• 结合图示与数学分析

本文通过图示和数学分析，直观解析Transformer模型的结构与机制，帮助读者理解其在NLP和CV中的应用。核心亮点包括自注意力机制、位置编码和前馈网络的详细说明。

媒体机器之心2026/02/22 20:565860

本文系统综述了多模态大语言模型中Token压缩技术，从图像、视频、音频三个模态出发，分类讨论了基于变换、相似度、注意力和查询的压缩方法，分析了性能与效率的权衡、部署难题及多轮对话适应性等挑战，并展望了跨模态协同压缩和原生高效架构等未来方向，为MLLM的效率优化提供了重要参考。