专题:aws

按该标签聚合的大模型资讯列表(自动分类与标签提取)。28 篇文章。

媒体freeCodeCamp2026/03/26 22:254840
使用 External Secrets Operator 同步 AWS 密钥到 Kubernetes
本地实验验证秘密同步与轮换机制

本文指导如何将 AWS Secrets Manager 的秘密同步到 Kubernetes Pod,使用 External Secrets Operator 实现自动同步与轮换。内容包括本地实验、部署流程、CI/CD 集成及故障排查,适合开发者和运维人员掌握敏感信息管理的实践方法。

官方AWS Machine Learning Blog2026/03/25 04:276820
预留GPU资源用于推理端点
支持时间窗口和实例类型选择

AWS SageMaker AI训练计划允许用户为推理端点预留固定GPU资源,确保在关键评估期或突发场景下有稳定的计算能力。文章介绍了具体操作流程、实例配置方法及管理策略,适用于需要可预测资源的AI模型部署。

媒体AWS Machine Learning Blog2026/03/19 22:206830
多区域数据驻留方案
集成 AWS IAM 与 Microsoft Entra ID

本文介绍如何通过 Amazon Quick 与 Microsoft Teams 集成实现多区域数据驻留。重点在于利用 AWS IAM Identity Center 和 Secrets Manager 进行跨系统身份验证和密钥管理,确保用户访问本地化资源。适用于受监管行业,如金融、医疗等,帮助企业满足 GDPR 和数据主权合规要求。

媒体AWS Machine Learning Blog2026/03/17 23:517950
游戏化AI培训提升参与度
微调LLM实现领域定制

AWS AI League通过游戏化、实践导向的学习模式,帮助组织提升AI技能,特别是LLM微调技术。结合SageMaker等工具,Atos在保险核保领域成功应用,展示了微调模型在准确性和成本效益上的优势。

媒体InfoQ 中文2026/03/17 22:007620
AWS 推出 AI Agent 实验室 Strands Labs
探索 AI Agent 在多个场景的应用潜力

AWS 推出 Strands Labs,专注于实验性 AI Agent 项目。该实验室旨在探索 AI Agent 在自动化、决策支持等场景的应用潜力,结合 AWS 云服务与 AI 技术,推动创新并加速落地。核心亮点包括与现有 AI 工具的整合及实验性 API 的发布。

官方AWS Machine Learning Blog2026/03/17 04:517830
AWS部署百万级NVIDIA GPU
EC2支持新型Blackwell GPU

AWS与NVIDIA在2026年GTC大会上深化AI合作,部署百万级GPU、支持新型EC2实例、优化分布式LLM推理及提升Apache Spark性能。此举旨在帮助企业构建稳定、可扩展且合规的AI生产系统,为开发者和研究人员提供更强大的工具。

媒体InfoQ 中文2026/03/17 02:066840
多 Agent 分析中台架构设计
ChatBI 实现自然语言交互

本文介绍了 Snowflake 与亚马逊云科技联合构建的多 Agent 分析中台和 ChatBI 架构,通过 NLP 和 ML 技术实现自然语言交互分析。核心亮点包括数据湖架构、多智能体协作、实时分析能力及行业应用案例,适用于企业级数据分析和决策支持场景。

媒体AWS Machine Learning Blog2026/03/12 23:577930
微调NVIDIA ASR模型以适应医疗领域
结合AWS与开源工具构建ASR系统

本文介绍如何在AWS上微调NVIDIA Parakeet TDT 0.6B V2 ASR模型,以适应医疗等特定领域。通过合成数据和开源工具,构建端到端系统,提升模型在医学术语、口音和噪声环境下的识别性能,并实现高效部署。

媒体freeCodeCamp2026/03/12 02:196830
无服务器RAG管道,成本可控
支持多模态内容处理

本文指导如何在AWS上构建一个零成本扩展的无服务器RAG管道,支持多种文件格式处理。通过优化成本结构,实现数据摄入一次性付费,运营阶段几乎无费用。适用于构建可搜索的知识库、AI聊天系统等应用。

官方AWS Machine Learning Blog2026/03/05 04:425830
AWS GenAI IDP加速器实现7倍处理能力提升
无服务器架构缩短客户入职周期至数天

Ricoh通过AWS GenAI IDP加速器构建智能文档处理方案,整合生成式AI与无服务器架构,解决医疗领域文档处理扩展难题。方案实现处理能力提升7倍,月均处理超7万份文档,缩短部署周期至数天,工程时间减少90%以上。核心亮点包括多租户架构设计、OCR与AI模型混合应用、置信度评分集成及模块化系统构建,满足HIPAA等严格合规要求。

媒体AWS Machine Learning Blog2026/03/04 00:236850
Amazon Nova Canvas降低退货率
支持多渠道虚拟试穿部署

Amazon Nova Canvas是AWS推出的虚拟试穿解决方案,旨在降低服装退货率。通过AI技术精准拟合产品到人体模型,支持多渠道部署,并结合无服务器架构实现高效处理。文章提供代码示例和部署指南,适合开发者参考。

官方AWS Machine Learning Blog2026/03/03 02:515830

本文详细阐述了如何利用Amazon Bedrock(集成Claude)、LangGraph和Amazon SageMaker AI上的Managed MLflow,构建一个无服务器对话式AI代理。该方案旨在解决传统客服助手僵化及直接使用LLM缺乏结构的问题,通过图式对话流程、状态管理与工具调用,实现客户订单查询、取消等复杂多轮交互,并提供全面的可观测性。

官方OpenAI Blog2026/02/27 13:306360

OpenAI与亚马逊近日宣布达成战略合作,核心是将OpenAI的Frontier平台引入亚马逊云科技(AWS)。此举旨在显著增强AI基础设施能力,为开发者和企业提供更强大的资源,以支持定制化AI模型的开发与部署。通过在AWS上运行Frontier平台,双方将共同推动企业级AI应用,特别是智能企业AI代理的广泛落地。此次合作不仅深化了领先AI模型提供商与云服…