北大团队提出HISA稀疏注意力机制,超长文本处理速度提升四倍原文媒体量子位2026/04/06 23:255810• HISA提升超长文本处理速度• 无需重新训练,即插即用北大团队提出HISA稀疏注意力机制,通过分层筛选提升超长文本处理速度,最高提速四倍且精度几乎不变,具备即插即用、工程友好等优势。注意力机制稀疏注意力大语言模型上下文长度模型优化