专题:state-space-models

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体Lobsters AI2026/03/27 09:377940
Mamba 替代 Transformer 的自注意力机制
采用选择性状态空间实现线性复杂度

Mamba 是一种基于选择性状态空间的线性时间序列建模方法,旨在替代传统 Transformer。其核心优势在于线性复杂度和对长序列的高效处理能力,适用于资源受限场景。文章介绍了其架构、训练方法及实验结果,展示了其在多个任务中的优越表现。