专题：language-model

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 5 篇文章。

Kagi Translate新增LinkedIn Speak输出语言支持

原文

社区Hacker News2026/03/17 12:396740

• Kagi Translate支持LinkedIn Speak输出

• AI实现语言风格迁移与适配

Kagi Translate新增LinkedIn Speak输出语言支持，帮助用户生成符合职业社交平台风格的翻译内容。该功能基于AI模型和语言风格迁移技术，提升了内容的可读性和传播效果，是AI在文本生成和语言适配领域的重要应用。

语言模型风格迁移内容优化 LinkedIn Speak NLP翻译

Mercury：基于扩散的超高速代码生成模型

原文

媒体Lobsters AI2026/02/25 18:025730

Mercury 系列模型采用扩散算法实现并行文本生成，在 H100 GPU 上实现 1,109 tokens/s 的超高速解码。Mini 版在质量评测中与 GPT‑4o、Claude 3.5 Haiku 等主流模型持平，平均延迟仅 25 ms。该工作证明扩散模型可在离散序列上大规模训练，为代码生成等高吞吐任务提供了新的高效路径。

扩散模型语言模型并行解码 GPU 加速代码生成

Stearling-8B：可解释生成词汇的语言模型

原文

社区Hacker News2026/02/24 08:386890

Stearling-8B 是一个具备词汇解释能力的语言模型，能够对生成的每个 token 提供解释。其核心亮点在于提升模型的透明度和可控性，适用于需要深度理解生成内容的场景。该模型结合了注意力机制与解释模块，为语言模型的可解释性研究提供了新方向。

语言模型可解释性注意力机制优化 token 解释 LLM架构

GPT‑2 残差流中的异常转变：句点歧义与灾变理论的意外关联

原文

社区Reddit r/LocalLLaMA2026/02/20 22:554640

作者在 GPT‑2 的残差流中发现，句子“The temperature was 98.”的句点会被模型误判为小数点，置信度 88%。通过特定的 768 维方向干预，模型的判定会突变且呈不对称性——从数值化到结构化的转变所需力度约为逆向的四倍。该行为与灾变理论的折叠模型吻合，作者提供了可在 CPU 上 29 秒复现的开源脚本，邀请社区验证其普遍性。

GPT-2 残差流灾变理论语言模型代码实验

Claude Opus 4.6 发布：自然语言处理模型的全面升级

原文

官方Anthropic YouTube2026/02/06 01:457630

Claude Opus 4.6 是 Claude 系列最新自然语言处理模型，基于 Transformer 架构，显著提升了语言理解、生成能力和对话流畅性。适用于复杂文本处理和自然交互场景，为 NLP 领域带来更多创新可能。

Transformer 架构自然语言处理语言模型对话系统模型升级