专题:strix-halo

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

社区Reddit r/LocalLLaMA2026/02/09 22:0430

本文作者对 Strix Halo 模型进行了量化测试,发现自定义 imatrix Q4_K_S 版本在困惑度和模型体积上优于标准 Q4_K_M。在 ROCm 和 Vulkan 后端测试中,ROCm 在速度和能耗方面均显著优于 Vulkan,尤其是在处理长上下文时。作者计划未来主要使用 ROCm 作为 Strix Halo 的后端。