专题:silicon-model

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

社区Reddit r/LocalLLaMA2026/02/22 19:246530

chatjimmy.ai 采用 mask ROM recall fabric 技术,将 LLM 权重硬刻在 ASIC 上,实现每秒 15,414 token 的推理速度,摆脱了 HBM/VRAM 限制。作者对比了自购的 NVIDIA Spark/Grace GPU,探讨专用 ASIC 是否会快速上市并让桌面 GPU 开发变得过时。文章重点在硬件架构差异及未…