专题：parallel-decoding

Mercury：基于扩散的超高速代码生成模型

媒体Lobsters AI2026/02/25 18:025730

Mercury 系列模型采用扩散算法实现并行文本生成，在 H100 GPU 上实现 1,109 tokens/s 的超高速解码。Mini 版在质量评测中与 GPT‑4o、Claude 3.5 Haiku 等主流模型持平，平均延迟仅 25 ms。该工作证明扩散模型可在离散序列上大规模训练，为代码生成等高吞吐任务提供了新的高效路径。

扩散模型语言模型并行解码 GPU 加速代码生成