专题:inference-chip

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体量子位2026/02/21 14:318730

Taalas 以 24 人团队推出 HC1 芯片,将 Llama 3.1‑8B 硬编码进掩模 ROM,实现每秒 17000 token 推理,功耗仅 250 W,成本与能效均显著优于现有 GPU/ASIC。技术核心是结构化 ASIC 与模型硬连线,已展示多模型扩展方案,预计 2024 年将陆续发布二代产品。