Stearling-8B:可解释生成词汇的语言模型原文社区Hacker News2026/02/24 08:386890Stearling-8B 是一个具备词汇解释能力的语言模型,能够对生成的每个 token 提供解释。其核心亮点在于提升模型的透明度和可控性,适用于需要深度理解生成内容的场景。该模型结合了注意力机制与解释模块,为语言模型的可解释性研究提供了新方向。语言模型可解释性注意力机制优化token 解释LLM架构