专题：iclr2026

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 1 篇文章。

谷歌TurboQuant压缩算法：KV Cache压缩6倍，精度无损

媒体量子位2026/03/26 11:038940

• KV Cache压缩6倍

• 精度无损失

谷歌推出TurboQuant算法，将AI推理中的KV Cache压缩6倍，精度无损。该技术通过极坐标量化和量化JL变换实现，已在开源模型上验证效果，对内存市场带来冲击，但尚未大规模应用。