专题：token-explanation

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 1 篇文章。

Stearling-8B：可解释生成词汇的语言模型

社区Hacker News2026/02/24 08:386890

Stearling-8B 是一个具备词汇解释能力的语言模型，能够对生成的每个 token 提供解释。其核心亮点在于提升模型的透明度和可控性，适用于需要深度理解生成内容的场景。该模型结合了注意力机制与解释模块，为语言模型的可解释性研究提供了新方向。