专题:kubernetes

按该标签聚合的大模型资讯列表(自动分类与标签提取)。16 篇文章。

媒体freeCodeCamp2026/03/28 04:364740
kcp实现多逻辑集群统一管理
工作空间提供独立隔离环境

kcp是一个开源项目,允许在单个控制平面中运行多个逻辑Kubernetes集群。它通过工作空间实现隔离,减少集群数量和管理开销,适用于多租户、合规性及安全性要求高的场景。核心亮点包括解耦架构、灵活的API订阅机制和轻量级设计。

媒体freeCodeCamp2026/03/26 22:254840
使用 External Secrets Operator 同步 AWS 密钥到 Kubernetes
本地实验验证秘密同步与轮换机制

本文指导如何将 AWS Secrets Manager 的秘密同步到 Kubernetes Pod,使用 External Secrets Operator 实现自动同步与轮换。内容包括本地实验、部署流程、CI/CD 集成及故障排查,适合开发者和运维人员掌握敏感信息管理的实践方法。

媒体The Cloudflare Blog2026/03/26 21:004840
Kubernetes默认设置导致Atlantis重启慢
修改fsGroupChangePolicy优化重启性能

本文描述了Kubernetes因默认安全策略导致的Atlantis重启性能问题,通过调整`fsGroupChangePolicy`实现快速修复,每年节省600小时运维时间。核心亮点在于对系统行为的深入理解与配置优化。

官方Microsoft Azure Blog2026/03/24 15:057830
Azure Kubernetes Service新增DRA功能
AI Runway简化推理模型部署

微软在KubeCon + CloudNativeCon Europe 2026上展示了其在Kubernetes和开源AI基础设施领域的最新进展,包括Azure Kubernetes Service的新功能、AI Runway等开源项目的发布,以及Kubernetes本身的升级。这些成果旨在提升AI基础设施的统一性、安全性和可管理性,推动其在实际工作负载中的…

媒体freeCodeCamp2026/03/18 02:073840
使用Argo CD实现Kubernetes GitOps
GitHub Actions自动化构建镜像

本文讲解如何在Kubernetes上使用Argo CD实现GitOps,涵盖工具配置、仓库结构、自动化构建与镜像更新。通过Git作为单一真实来源,实现声明式部署、版本控制和自动同步,提升部署效率与可追溯性。

媒体ByteByteGo Newsletter2026/03/17 23:304930
无中断迁移 PB 级 Kafka 到 Kubernetes
采用 DNS 抽象和可逆步骤降低风险

Reddit 无中断迁移 PB 级 Kafka 到 Kubernetes,采用 DNS 抽象、ID 管理、混合集群、Cruise Control 数据转移和 KRaft 控制平面迁移等策略,确保系统稳定与可逆性,为大规模云原生架构迁移提供参考。

媒体InfoQ 中文2026/03/17 18:005840
Ray 在 AKS 上实现高效扩展
结合 Kubernetes 资源管理优化性能

本文介绍如何在 Azure Kubernetes Service 上规模化运行 Ray 框架,适用于 AI 和机器学习的分布式计算需求。核心亮点包括 Ray 的灵活性、高性能以及与 Kubernetes 的深度集成,为开发者提供了部署和优化的实践指导。

媒体AWS Machine Learning Blog2026/03/17 00:557920
llm-d 实现 LLM 分布式推理优化
分离 prefill 和 decode 阶段提升效率

AWS 与 llm-d 合作推出分布式推理技术,优化 LLM 的预填充和解码阶段,提升性能与资源利用率。通过智能调度、并行处理和分层缓存机制,llm-d 支持多节点部署,适用于大规模模型和复杂工作负载。

媒体freeCodeCamp2026/03/06 22:436940
真实集群模拟Kubernetes自愈过程
观察Pod、节点、探针等组件行为

本文通过真实Kubernetes集群实验,演示了多种故障场景及其自愈机制,帮助开发者和运维人员理解Kubernetes如何自动恢复服务。内容涵盖ReplicaSet、StatefulSet、OOMKill、就绪探针等关键概念,并提供了监控和排查方法。

媒体AWS Machine Learning Blog2026/02/20 00:287630

本文深入探讨了如何利用开源项目 Flyte 和企业级解决方案 Union.ai 在 Amazon EKS 上构建可扩展、高可靠的 AI/ML 工作流。文章指出,AI项目从实验到生产面临基础设施复杂性、可复现性等挑战,而Flyte提供Python原生编排能力,Union.ai则通过托管服务、企业级安全和与AWS服务的深度集成,简化了运营开销。通过Woven …

媒体Mat Duggan2026/02/16 20:056840

本文通过个人使用Claude Code的体验,探讨了LLM在代码生成任务中的实际效果与伦理问题。作者指出LLM虽能提升效率,但其对知识的窃取和对代码质量的忽视令人担忧。文章还反思了LLM对开发者职业身份的影响,并分析了职场中使用LLM的动机。