Qwen 3.5 9B模型本地部署性能优化指南原文社区Reddit r/LocalLLaMA2026/03/04 21:053640本文探讨如何优化Qwen 3.5 9B模型在本地部署时的性能,针对NVIDIA 5070Ti显卡和64GB内存的配置,分析吞吐量低的问题并提供可能的解决方案。核心亮点在于对模型运行效率的实测与优化建议。通义千问模型优化技术本地部署GPU性能token生成