Qwen3.5在AMD RX 9070 XT显卡上Vulkan后端性能异常分析
Reddit r/LocalLLaMA2026/03/04 21:06机翻/自动摘要/自动分类
4 阅读
内容评分
技术含量
8/10
营销水分
3/10
摘要
用户在AMD RX 9070 XT显卡上使用Vulkan后端运行Qwen3.5模型时遇到性能问题,HIP后端表现更优。测试数据表明Vulkan后端吞吐量低,功耗异常,但输出正确。问题可能与显卡架构或后端实现有关,需进一步排查。
正文
在使用最新的lama.cpp(版本b8196)和Vulkan后端运行Qwen3.5的4B和9B模型时,发现性能极差。尽管在CPU上运行速度较慢(仅慢约2.5倍),但使用lama-cpp HIP后端后,性能显著提升。测试结果显示,Vulkan后端在相同模型下吞吐量明显低于HIP后端,且显卡使用率始终为100%,但功耗远低于预期。已尝试清理系统缓存、更新显卡驱动及启用flash-attention功能,但问题依旧存在。文章探讨了Vulkan后端与RDNA4架构显卡在运行Qwen3.5模型时的性能差异,并询问是否有其他用户遇到类似问题及解决方法。