专题：ai-chip

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 6 篇文章。

国内首个国产AI推理千卡集群落地，云天励飞全自研芯片助力AI应用加速

原文

媒体InfoQ 中文2026/03/12 19:557830

• 国内首个国产AI推理千卡集群落地

• 采用云天励飞全自研AI推理芯片

国内首个国产AI推理千卡集群落地，采用云天励飞全自研芯片，提升计算效率并降低能耗，已在多个行业场景中测试应用，具备高能效比和稳定性。

AI芯片推理集群云天励飞边缘计算 AI计算硬件

微软重磅发布自研AI推理芯片，强化云端AI算力布局

原文

社区Reddit r/LocalLLaMA2026/02/22 18:226520

微软近日重磅发布了一款全新的自研AI推理芯片，旨在显著提升其Azure云平台在处理大型语言模型（LLM）及其他复杂AI推理任务时的性能与效率。此举是微软在AI硬件领域的重要战略布局，旨在减少对第三方GPU的依赖，并为客户提供更具成本效益和性能优势的AI算力。该芯片的核心亮点在于其针对AI推理工作负载的深度优化，包括高吞吐量、低延迟和卓越的能效比。它将与Az…

AI芯片推理加速微软 Azure 大语言模型硬件优化

Taalas HC1：24人团队打造的结构化 ASIC，推理速率达 17000 token/s，功耗仅 250 W

原文

媒体量子位2026/02/21 14:318740

Taalas 以 24 人团队推出 HC1 芯片，将 Llama 3.1‑8B 硬编码进掩模 ROM，实现每秒 17000 token 推理，功耗仅 250 W，成本与能效均显著优于现有 GPU/ASIC。技术核心是结构化 ASIC 与模型硬连线，已展示多模型扩展方案，预计 2024 年将陆续发布二代产品。

LLM模型硬件优化推理芯片 AI芯片结构化ASIC

太初元碁实现 40+ 大模型即发即适配，国产算力高效落地

原文

媒体量子位2026/02/19 14:116620

太初元碁在两天内完成对 40+ 主流大模型的即发即适配，提供 SDAA Copilot、Teco‑Triton、SDAA C、PCX 指令集和 Teco‑vLLM 等工具链，实现算子自动生成、跨平台兼容和零成本迁移。公司强调集群互联、推理性价比和生态兼容是国产 AI 芯片的三大核心竞争力，力图在大模型“周更”时代抢占算力话语权。

AI芯片大模型适配软硬件协同 AI生态系统大模型适配