Pure WebGPU BitNet 推理:在任意 GPU 浏览器中免 CUDA 运行 LLM原文社区Reddit r/LocalLLaMA2026/02/20 21:495720作者全新用 WGSL 编写神经网络算子,实现了 BitNet 大语言模型的纯 WebGPU 推理。该方案无需 CUDA,兼容所有支持 WebGPU 的 GPU,在浏览器或 wgpu‑native 环境下均可运行,已在 HuggingFace Spaces 部署演示,代码开源,面向开发者提供了在浏览器端部署 LLM 的可行路径。WebGPUBitNetLLM模型WGSL浏览器推理