AMD Lemonade：基于 GPU 与 NPU 的高性能开源本地大语言模型服务器

Hacker News2026/04/02 19:04机翻/自动摘要/自动分类

内容评分

技术含量

5/10

营销水分

5/10

AMD 推出的开源本地 LLM 服务器 Lemonade，结合 GPU 与 NPU 实现高效推理和训练。通过统一调度层自动选路，提供 Docker 镜像和一键脚本，降低部署门槛。采用 Apache 2.0 许可证，面向企业和个人开发者，支持多种模型格式，旨在推动本地 AI 应用落地。

AMD 最近发布了 Lemonade，这是一款面向本地部署的大语言模型（）服务器。Lemonade 完全开源，核心实现利用 AMD 的 GPU 与新推出的 NPU 加速单元，实现了高吞吐量的模型推理和训练。

Lemonade 的目标是降低本地的使用门槛，让企业和个人开发者在不依赖云算力的前提下，快速构建聊天机器人、文档摘要等 AI 应用。