专题：token-generation

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 1 篇文章。

Qwen 3.5 9B模型本地部署性能优化指南

社区Reddit r/LocalLLaMA2026/03/04 21:053640

本文探讨如何优化Qwen 3.5 9B模型在本地部署时的性能，针对NVIDIA 5070Ti显卡和64GB内存的配置，分析吞吐量低的问题并提供可能的解决方案。核心亮点在于对模型运行效率的实测与优化建议。