专题:cloud-native

按该标签聚合的大模型资讯列表(自动分类与标签提取)。10 篇文章。

媒体ByteByteGo Newsletter2026/03/17 23:304930
无中断迁移 PB 级 Kafka 到 Kubernetes
采用 DNS 抽象和可逆步骤降低风险

Reddit 无中断迁移 PB 级 Kafka 到 Kubernetes,采用 DNS 抽象、ID 管理、混合集群、Cruise Control 数据转移和 KRaft 控制平面迁移等策略,确保系统稳定与可逆性,为大规模云原生架构迁移提供参考。

媒体InfoQ 中文2026/03/17 19:087830
Snowflake 构建 AI 就绪型数据基座
支持数据工程与科学实战应用

Snowflake 在 AI 技术实战周中推出 AI 就绪型数据平台,强调数据工程与科学的实战应用。该平台支持多种 AI 模型训练与部署,具备数据管道自动化、实时分析和机器学习集成等功能,同时兼容主流 AI 框架,强化数据安全。

媒体InfoQ 中文2026/03/17 18:005840
Ray 在 AKS 上实现高效扩展
结合 Kubernetes 资源管理优化性能

本文介绍如何在 Azure Kubernetes Service 上规模化运行 Ray 框架,适用于 AI 和机器学习的分布式计算需求。核心亮点包括 Ray 的灵活性、高性能以及与 Kubernetes 的深度集成,为开发者提供了部署和优化的实践指导。

媒体InfoQ2026/03/12 17:004830
解决 AKS 上 Ray GPU 资源限制问题
优化机器学习存储资源管理

本文介绍了在 Azure Kubernetes Service 上大规模部署 Ray 服务的实践指南,重点解决 GPU 资源限制、存储分散和凭据过期等问题。适用于 AI 和 LLM 的分布式训练与部署,提供实用解决方案和最佳实践。