专题:ray

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

媒体InfoQ 中文2026/03/17 18:005840
Ray 在 AKS 上实现高效扩展
结合 Kubernetes 资源管理优化性能

本文介绍如何在 Azure Kubernetes Service 上规模化运行 Ray 框架,适用于 AI 和机器学习的分布式计算需求。核心亮点包括 Ray 的灵活性、高性能以及与 Kubernetes 的深度集成,为开发者提供了部署和优化的实践指导。

媒体InfoQ2026/03/12 17:004830
解决 AKS 上 Ray GPU 资源限制问题
优化机器学习存储资源管理

本文介绍了在 Azure Kubernetes Service 上大规模部署 Ray 服务的实践指南,重点解决 GPU 资源限制、存储分散和凭据过期等问题。适用于 AI 和 LLM 的分布式训练与部署,提供实用解决方案和最佳实践。

媒体AWS Machine Learning Blog2026/02/24 23:466830

本文介绍如何在 Amazon SageMaker 上使用 Ray 和 veRL 训练 CodeFu-7B,一个专为竞争性编程设计的 70 亿参数模型。通过强化学习和分布式训练,该模型在算法推理和代码生成方面表现出色。文章提供了完整的实现流程和资源链接,适合开发者和研究人员参考。