专题:memory_optimization

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

社区Hacker News2026/03/25 00:026840
利用NVMe实现张量流式传输
优化内存瓶颈问题

本文介绍在32GB内存Mac上运行1T参数AI模型的方法,通过NVMe流式传输张量数据,解决内存瓶颈问题。技术方案涵盖NVMe存储特性、张量处理机制及优化策略,对资源受限环境下的模型部署具有参考价值。