国内首个国产AI推理千卡集群落地,采用云天励飞全自研芯片,提升计算效率并降低能耗,已在多个行业场景中测试应用,具备高能效比和稳定性。
专题:ai-chip
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 6 篇文章。
微软近日重磅发布了一款全新的自研AI推理芯片,旨在显著提升其Azure云平台在处理大型语言模型(LLM)及其他复杂AI推理任务时的性能与效率。此举是微软在AI硬件领域的重要战略布局,旨在减少对第三方GPU的依赖,并为客户提供更具成本效益和性能优势的AI算力。该芯片的核心亮点在于其针对AI推理工作负载的深度优化,包括高吞吐量、低延迟和卓越的能效比。它将与Az…
Taalas 以 24 人团队推出 HC1 芯片,将 Llama 3.1‑8B 硬编码进掩模 ROM,实现每秒 17000 token 推理,功耗仅 250 W,成本与能效均显著优于现有 GPU/ASIC。技术核心是结构化 ASIC 与模型硬连线,已展示多模型扩展方案,预计 2024 年将陆续发布二代产品。
太初元碁在两天内完成对 40+ 主流大模型的即发即适配,提供 SDAA Copilot、Teco‑Triton、SDAA C、PCX 指令集和 Teco‑vLLM 等工具链,实现算子自动生成、跨平台兼容和零成本迁移。公司强调集群互联、推理性价比和生态兼容是国产 AI 芯片的三大核心竞争力,力图在大模型“周更”时代抢占算力话语权。
NVIDIA在CES 2026发布新一代AI芯片Vera Rubin,搭载HBM4和88个Olympus核心,性能提升5倍。同时推出Alpamayo开放AI模型和Vera Rubin计算平台,旨在提升自动驾驶车辆的决策能力。该发布标志着NVIDIA在AI硬件和自动驾驶技术上的重要突破。
NVIDIA以200亿美元收购Groq,强化AI芯片布局。Groq估值达69亿美元,技术聚焦于高性能推理芯片。此次交易对AI行业和大公司战略具有重要影响。