专题:language-model

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

社区Hacker News2026/03/17 12:396740
Kagi Translate支持LinkedIn Speak输出
AI实现语言风格迁移与适配

Kagi Translate新增LinkedIn Speak输出语言支持,帮助用户生成符合职业社交平台风格的翻译内容。该功能基于AI模型和语言风格迁移技术,提升了内容的可读性和传播效果,是AI在文本生成和语言适配领域的重要应用。

媒体Lobsters AI2026/02/25 18:025730

Mercury 系列模型采用扩散算法实现并行文本生成,在 H100 GPU 上实现 1,109 tokens/s 的超高速解码。Mini 版在质量评测中与 GPT‑4o、Claude 3.5 Haiku 等主流模型持平,平均延迟仅 25 ms。该工作证明扩散模型可在离散序列上大规模训练,为代码生成等高吞吐任务提供了新的高效路径。

社区Reddit r/LocalLLaMA2026/02/20 22:554640

作者在 GPT‑2 的残差流中发现,句子“The temperature was 98.”的句点会被模型误判为小数点,置信度 88%。通过特定的 768 维方向干预,模型的判定会突变且呈不对称性——从数值化到结构化的转变所需力度约为逆向的四倍。该行为与灾变理论的折叠模型吻合,作者提供了可在 CPU 上 29 秒复现的开源脚本,邀请社区验证其普遍性。