KernelEvolve:Meta自主代理系统优化异构AI硬件性能
Engineering at Meta2026/04/03 03:59机翻/自动摘要/自动分类
0 阅读
内容评分
技术含量
8/10
营销水分
4/10
摘要
KernelEvolve是Meta开发的代理式内核优化系统,针对异构AI硬件(NVIDIA/AMD GPU、MTIA芯片)实现自动化内核生成。通过LLM合成器、树搜索引擎和检索增强知识库,系统可跨平台优化模型性能,显著提升推理和训练吞吐量。该技术已应用于生产环境,优化每天数万亿次的广告模型推理请求,标志着AI软硬件协同优化的新范式。
正文
Meta推出KernelEvolve系统,旨在解决AI基础设施中异构硬件(NVIDIA GPU、AMD GPU、MTIA芯片、CPU)的内核优化难题。该系统通过将内核优化转化为搜索问题,利用大型语言模型()生成候选方案,并结合树搜索算法、检索增强知识库和自动化评估框架进行高效优化。KernelEvolve显著提升了广告模型的推理吞吐量(NVIDIA GPU提升60%以上,MTIA芯片训练吞吐量提升25%以上),并支持多种编程语言和框架(如CUDA、HIP、Triton等)。其核心价值在于通过自动化减少人工调优负担,加速AI硬件与模型的协同迭代。文章还提到该技术可扩展至混合模型搜索、编译器优化等领域,为Meta的AI基础设施提供持续优化能力。