大模型资讯聚合站

专题：flashattention-4

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

英伟达B200算力浪费60%？普林斯顿团队推出FlashAttention-4提升利用率至71%

媒体量子位2026/03/18 08:315920

• B200算力利用率不足20%

• FlashAttention-4提升至71%

英伟达B200 GPU因软硬件不匹配导致算力浪费，FlashAttention-4通过算法优化将利用率提升至71%，并实现编译效率飞跃，适用于大模型训练与推理。

FlashAttention-4 Blackwell B200 张量核心优化 CuTe-DSL框架条件性softmax缩放

OpenAI发布GPT-5.4及GPT-5.4 Pro，强化编程与计算能力

媒体AINews2026/03/05 13:447820

• GPT-5.4支持原生计算机操作

• Codex /fast模式提升效率

OpenAI发布GPT-5.4和GPT-5.4 Pro，支持原生计算机操作和超长上下文处理，效率优化显著。新模型在编程任务中表现优异，FlashAttention-4技术提升计算性能，为开发者和研究者带来实际价值。

GPT-5.4系列 Codex FlashAttention-4 GPU优化编程能力