首页/详情

微软在Kubernetes与开源AI基础设施领域的突破性进展

Microsoft Azure Blog2026/03/24 15:05机翻/自动摘要/自动分类
3 阅读

内容评分

技术含量
8/10
营销水分
7/10

摘要

微软在KubeCon + CloudNativeCon Europe 2026上展示了其在Kubernetes和开源AI基础设施领域的最新进展,包括Azure Kubernetes Service的新功能、AI Runway等开源项目的发布,以及Kubernetes本身的升级。这些成果旨在提升AI基础设施的统一性、安全性和可管理性,推动其在实际工作负载中的应用。

正文

复杂技术的成熟通常遵循一定的模式。在初期,各个团队会自行选择不同的工具、抽象方式以及处理故障的逻辑。这种灵活性看似有益,但在大规模应用时却会导致系统碎片化。解决这一问题的关键不在于增加功能,而在于建立统一的运营理念。Kubernetes就是一个典范——它不仅回答了“如何运行容器?”的问题,还解决了“如何安全地改造现有系统?”的问题。社区共同构建并完善了这些最佳实践,使其成为行业标准。

目前,AI基础设施仍处于混乱阶段。从“系统能否正常运行”到“哪些方案更优”的转变,本质上属于运营层面的挑战,仅靠更多工具是无法解决的。唯有通过开源技术(如Kubernetes)以及社区的力量,才能建立统一的接口和可复制的操作规范,从而取代个人的主观判断。

自2025年KubeCon + CloudNativeCon North America以来,微软团队持续在开源AI基础设施、多集群管理、网络技术、可观测性、存储系统以及集群生命周期管理等领域进行投入。在2026年阿姆斯特丹举行的KubeCon + CloudNativeCon Europe大会上,微软将公布多项新成果,旨在将Kubernetes的成熟度应用到当前的实际工作负载中。

具体亮点包括:

  1. Azure Kubernetes Service的新功能:
    • 动态资源分配(DRA)已正式上线,相关驱动程序和管理员工具也已发布;
    • Kubernetes 1.36版本支持基于工作负载的调度策略,便于开发者申请和管理高性能计算资源;
    • DRANet支持Azure RDMA网络接口卡,提升了GPU与网络之间的性能。
  2. AI基础设施的改进:
    • 新开源项目AI Runway为推理工作负载提供了统一的Kubernetes API,简化了模型部署和管理流程;
    • Cilium增强了安全性与可观测性;
    • Azure Kubernetes Application Network提供了更灵活的网络管理机制。
  3. Kubernetes本身的升级:
    • 支持基于身份的授权和流量监控;
    • 引入了基于X.509证书的加密通信机制;
    • 扩展了Pod的IP地址范围,简化了集群管理。

微软在KubeCon + CloudNativeCon Europe 2026上的更多活动:

  • 客户主题演讲:
    • 3月24日(周二)9:37,Jorge Palma(微软首席PDM经理)将分享如何利用AI提升平台运营效率;
    • 3月25日(周三)1:15,Jorge Palma和Anson Qian将探讨如何在Kubernetes上构建跨云AI基础设施。
  • 现场演示与交流:
    • 可参观我们的展位(200号),与Azure和AKS团队进行交流;
    • 查看微软演讲者的完整日程安排。

了解更多关于Azure Kubernetes Service的信息,请访问: https://opensource.microsoft.com/blog/2026/03/24/whats-new-with-microsoft-in-open-source-and-kubernetes-at-kubecon-cloudnativecon-europe-2026

标签