专题：cloud-computing

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 13 篇文章。

从云原生到AI原生：新一代基础设施的模型驱动演进

原文

媒体InfoQ 中文2026/03/27 01:356830

• 云原生向AI原生演进

• 模型驱动提升系统效率

本文探讨了从云原生到AI原生基础设施的演进趋势，强调模型驱动在构建新一代系统中的关键作用。分析了AI原生架构的技术特点、应用场景及面临的挑战，为开发者和研究人员提供了有价值的参考。

AI原生基础设施模型驱动云计算资源优化边缘计算

AWS SageMaker AI训练计划：为推理端点预留GPU资源

原文

官方AWS Machine Learning Blog2026/03/25 04:276820

• 预留GPU资源用于推理端点

• 支持时间窗口和实例类型选择

AWS SageMaker AI训练计划允许用户为推理端点预留固定GPU资源，确保在关键评估期或突发场景下有稳定的计算能力。文章介绍了具体操作流程、实例配置方法及管理策略，适用于需要可预测资源的AI模型部署。

训练计划 AI 推理 AWS Amazon SageMaker GPU资源预留

AI计算成本优化：DRA与vGPU技术解析

原文

媒体InfoQ 中文2026/03/21 16:005830

• DRA优化专属资源分配

• vGPU实现GPU虚拟化

本文介绍AI计算成本优化的两种关键技术：DRA和vGPU。DRA通过专属资源分配提升效率，vGPU利用虚拟化技术实现多任务并行。两者在AI部署中具有重要应用价值，有助于降低硬件成本和资源浪费。

专属资源分配虚拟GPU AI成本优化资源管理云计算

Chamber：专为GPU基础设施打造的AI管理助手

原文

社区Hacker News2026/03/17 01:096860

• AI助手管理GPU基础设施

• 实时监控与智能决策

Chamber是一款专为GPU基础设施设计的AI助手，能够实时监控集群状态并自动处理资源调度、故障诊断等任务。其核心优势在于结构化操作、智能诊断和安全性设计，尤其适合AI团队和平台工程师使用。

GPU管理 AI代理基础设施监控自动化诊断云计算

云与智能自动化重塑受监管行业数字化转型路径

原文

官方Microsoft Azure Blog2026/03/12 00:007650

• 云技术助力企业降本增效

• 智能自动化加速迁移与合规

云与智能自动化技术正在推动受监管行业（如医疗、金融、制造）的现代化转型。通过降低IT成本、提升AI应用能力、优化系统韧性及满足合规要求，企业能够更高效、安全地实现数字化升级。微软Azure的工具如Copilot和GitHub Copilot为这一转型提供了关键支持。

云计算代理式AI 合规性 Azure云平台数字化转型

微软推出《The Shift》播客：深入探讨代理式AI技术挑战与应用

原文

官方Microsoft Azure Blog2026/03/10 02:116550

• 微软推出代理式AI播客

• 探讨数据与云平台挑战

微软推出《The Shift》播客，系统解析代理式AI技术生态。通过讨论数据统一、云平台扩展、跨系统协作等核心议题，结合Microsoft Fabric、OneLake等产品实践，为开发者提供技术洞察。播客聚焦实际应用挑战，如RAG技术边界、数据库需求及安全治理，旨在推动AI代理技术落地。

AI平台系统架构云AI AI运维数据策略

林俊旸离职背后：小模型崛起与云厂商的商业困境

原文

媒体爱范儿2026/03/05 19:477830

Qwen 3.5 Small模型以9B参数实现高性能推理，可在本地设备运行，挑战了'模型越大越聪明'的行业共识。其发布与林俊旸离职事件引发对AI行业技术路线与商业利益冲突的讨论，凸显小模型在效率与灵活性上的优势，以及对云厂商的潜在冲击。

小型模型量化技术模型效率云计算 AI行业趋势

Azure IaaS资源中心：现代云基础设施的创新与优化之道

原文

官方Microsoft Azure Blog2026/03/05 01:007830

• Azure IaaS支持AI、全球应用和关键业务系统

• 提供弹性扩展与多层安全防护

Azure IaaS资源中心是支持现代云基础设施设计、优化和运营的集中平台，强调性能、安全性、弹性扩展和成本效率。它为AI工作负载、全球应用和关键业务系统提供全面支持，帮助组织在数字化转型中保持创新与稳定。

云资源优化性能与扩展安全与合规 Azure基础设施即服务 AI基础设施

Formae平台工程实验室扩展多云支持，推动AI模型部署优化

原文

媒体InfoQ 中文2026/03/04 19:056840

Formae平台工程实验室扩展多云支持，提升AI模型部署的灵活性和效率。新增对主流云平台的兼容性、智能资源调度算法和统一API管理，为企业级AI应用提供更强大的基础设施支持。

多云架构平台工程 AI部署云计算资源优化

谷歌优化GKE节点池自动创建速度，提升大规模AI集群性能

原文

媒体InfoQ2026/03/03 16:005730

谷歌优化GKE节点池自动创建机制，缩短准备时间，提升AI和批处理任务的扩展性与稳定性。改进控制平面通信和资源分配，性能媲美Karpenter。

Google Kubernetes Engine Kubernetes AI基础设施云计算资源管理

Azure 增量快照即时访问：无需等待即可恢复数据

原文

官方Microsoft Azure Blog2026/03/03 01:007830

• 快照创建后立即恢复磁盘

• 提供接近满负荷的性能

Azure 推出增量快照即时访问功能，允许用户在快照创建后立即恢复磁盘，无需等待数据复制。该功能提升了恢复速度和性能，适用于关键业务场景，如快速回滚、维护和扩展。技术上通过高性能存储实现，支持跨区域恢复，并采用按使用计费模式。

Azure云平台即时访问快照云存储磁盘恢复云计算

谷歌云SRE实战：Gemini CLI如何赋能服务中断响应

原文

媒体InfoQ 中文2026/02/28 20:005760

谷歌云SRE团队利用Gemini大模型驱动的Gemini CLI工具，革新了服务中断的响应流程。该工具能理解自然语言指令，关联分析日志、指标等多源数据，并生成诊断建议，显著缩短故障排查时间。通过实际案例展示了其在快速定位问题和辅助修复方面的强大能力，预示着AI在智能运维领域的广阔前景。

Gemini 模型系统可靠性工程 LLM模型云计算 DevOps

OpenAI完成1100亿美元融资，创AI初创企业融资新纪录

原文

媒体AINews2026/02/27 13:448640

• OpenAI完成1100亿美元融资，创纪录

• 亚马逊、英伟达、软银为主要投资方

OpenAI完成1100亿美元融资，创历史新高。投资方包括软银、英伟达和亚马逊，凸显其在AI应用和基础设施领域的影响力。ChatGPT和Codex用户规模庞大，合作资源涵盖云服务和训练算力。

AI融资 AI基础设施 AI伦理大语言模型开发 AI监管