专题：npu

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 5 篇文章。

AMD Lemonade：基于 GPU 与 NPU 的高性能开源本地大语言模型服务器

社区Hacker News2026/04/02 19:045510

• AMD 开源本地 LLM 服务器 Lemonade

• GPU + NPU 协同加速推理/训练

AMD 推出的开源本地 LLM 服务器 Lemonade，结合 GPU 与 NPU 实现高效推理和训练。通过统一调度层自动选路，提供 Docker 镜像和一键脚本，降低部署门槛。采用 Apache 2.0 许可证，面向企业和个人开发者，支持多种模型格式，旨在推动本地 AI 应用落地。

AMD Lemonade GPU NPU 加速本地大语言模型服务器

LiteRT：面向设备端AI的下一代框架，性能提升与NPU支持

原文

官方Google Developers Blog2026/03/05 00:336830

LiteRT是TFLite的升级版，专注于设备端AI，提升GPU效率至1.4倍，支持NPU并优化GenAI模型部署。适用于边缘计算场景，增强AI在移动端和嵌入式设备的性能表现。

LiteRT TensorFlow Lite NPU 加速生成式AI 边缘计算

高通发布骁龙可穿戴平台至尊版：20 亿参数模型落地手表等微型设备

原文

媒体量子位2026/03/04 11:116720

高通在 MWC 推出骁龙可穿戴平台至尊版，采用 3 nm 双核 NPU 架构，提供 10 TOPS 算力，可在手表、眼镜等微型设备本地运行 20 亿参数大模型，实现低功耗本地推理，推动个人 AI 全场景落地。

骁龙可穿戴平台至尊版边缘AI NPU 加速可穿戴设备 3 nm 工艺

Google 开源 NPU 架构，Synaptics 首度落地实现

原文

社区Reddit r/LocalLLaMA2026/02/22 17:314520

Google 将自研 NPU IP 完全开源，提供 RTL、编译链和参考软件。Synaptics 迅速将其落地，实现了在消费电子中的加速验证，MobileNet‑V2 推理功耗降低约 70%，吞吐提升 3.5 倍。此举降低 AI 硬件研发门槛，促进边缘 AI 生态快速发展。

NPU 加速开源硬件 AI加速 Synaptics 谷歌

终于发现：我的机器NPU终于派上用场了

原文

社区Reddit r/LocalLLaMA2026/02/08 21:1250