专题:ai-infrastructure

按该标签聚合的大模型资讯列表(自动分类与标签提取)。23 篇文章。

官方Databricks Blog2026/04/02 15:206400
Unity Catalog Business Semantics全面发布
开源版本开放核心功能接口

Unity Catalog Business Semantics是面向企业数据管理的开源工具,通过统一业务语义框架解决数据孤岛问题。其核心价值在于实现跨系统数据逻辑一致性,助力开发者构建高质量AI应用。主要亮点包括开源授权、标准化语义模型和企业级数据治理能力。

官方Microsoft Azure Blog2026/03/24 15:057830
Azure Kubernetes Service新增DRA功能
AI Runway简化推理模型部署

微软在KubeCon + CloudNativeCon Europe 2026上展示了其在Kubernetes和开源AI基础设施领域的最新进展,包括Azure Kubernetes Service的新功能、AI Runway等开源项目的发布,以及Kubernetes本身的升级。这些成果旨在提升AI基础设施的统一性、安全性和可管理性,推动其在实际工作负载中的…

媒体InfoQ 中文2026/03/19 00:514730
支持多模态数据存储与处理
提升AI模型跨模态理解

多模态数据库技术是AI时代的重要基础设施,支持多种数据类型的存储与处理,提升AI模型的泛化能力和跨模态理解。文章分析了其架构、应用场景及技术挑战,强调其在AI训练与推理中的关键作用。

媒体Latent Space2026/03/13 14:515830
Agent基础设施优化提升模型能力
MCP协议改进增强交互性能

本文聚焦于提升大型语言模型能力的高回报技术活动,涵盖Agent基础设施优化、MCP协议改进、编码代理开发、多模态检索突破及模型发布进展。特别介绍了Claude交互式图表和Perplexity Computer等产品功能更新,展示了这些技术在实际应用中的价值。文章内容详实,技术深度高,对开发者和研究人员具有重要参考价值。

官方Microsoft Azure Blog2026/03/11 15:008920
Fireworks AI集成Microsoft Foundry
支持多模型推理与部署选项

Microsoft Foundry 集成 Fireworks AI,为企业提供统一的开放模型推理平台。该方案支持多款主流模型,包含无服务器部署和 PTU 计费模式,日处理能力达 13 万亿 tokens,每秒处理 18 万请求。核心亮点在于打通模型全生命周期管理,通过 BYOW 功能实现自定义权重部署,解决传统方案中工具碎片化导致的扩展难题,助力开发者高效…

官方Microsoft Azure Blog2026/03/07 01:007830
三年内开发者生产力收益达1570万美元
技术团队效率提升35%

Forrester研究显示,微软Foundry平台在企业AI实施中带来显著经济效益,三年内开发者生产力收益达1570万美元,技术团队效率提升35%。平台统一性提升运营效率,淘汰旧工具节省成本,同时强化AI治理与合规。建议企业将AI作为平台战略,推动可复用架构和共享治理。

官方Microsoft Azure Blog2026/03/05 01:007830
Azure IaaS支持AI、全球应用和关键业务系统
提供弹性扩展与多层安全防护

Azure IaaS资源中心是支持现代云基础设施设计、优化和运营的集中平台,强调性能、安全性、弹性扩展和成本效率。它为AI工作负载、全球应用和关键业务系统提供全面支持,帮助组织在数字化转型中保持创新与稳定。

媒体AINews2026/03/02 13:446830
Qwen 3.5支持多模态与轻量化部署
采用Gated DeltaNet混合注意力机制

阿里巴巴发布Qwen 3.5系列模型,涵盖0.8B至9B参数规模,支持多模态处理和扩展强化学习。模型采用Gated DeltaNet混合注意力机制,适用于边缘设备和轻量级应用。已在Ollama和LM Studio中集成,并在iPhone 17 Pro上实现6位精度运行。Codex 5.3在编码代理测试中表现良好,但系统稳定性仍是挑战。

媒体Latent Space2026/02/28 09:317720

SemiAnalysis创始人Dylan Patel在《情境烹饪》节目中,深入剖析AI基础设施领域的关键趋势。他预测亚马逊和谷歌每年将战略性投入高达2000亿美元于AI资本支出,并大胆预言谷歌利润可能在2027年归零。讨论涵盖台湾地缘政治对芯片供应链的影响、出口管制、英伟达的“偏执优势”、AI编程智能体的万亿美元级潜力,以及未来AI发展面临的能源、晶圆厂瓶…

官方OpenAI Blog2026/02/27 13:306370

OpenAI与亚马逊近日宣布达成战略合作,核心是将OpenAI的Frontier平台引入亚马逊云科技(AWS)。此举旨在显著增强AI基础设施能力,为开发者和企业提供更强大的资源,以支持定制化AI模型的开发与部署。通过在AWS上运行Frontier平台,双方将共同推动企业级AI应用,特别是智能企业AI代理的广泛落地。此次合作不仅深化了领先AI模型提供商与云服…

媒体AWS Machine Learning Blog2026/02/21 04:266740

2025 年 Amazon SageMaker AI 推出灵活训练计划用于推理端点,并通过多 AZ 高可用、LoRA 并行扩展和 EAGLE‑3 自适应解码四项技术显著提升推理成本性能。新功能实现 GPU 预留、容错提升和吞吐增长,帮助用户在生产环境中更高效、低成本地部署大模型。

社区Reddit r/LocalLLaMA2026/02/15 17:154770

本文深度对比了Runpod、Vast.ai和GPUHub三大主流GPU云平台,强调选择不应仅基于价格或硬件规格,而应考量平台架构、目标用户、稳定性、优化潜力及运营责任。Runpod以其易用性成为新手和短期项目的首选,但规模化成本较高。Vast.ai提供极致灵活性和成本效益,适合技术熟练、能自行管理技术栈的用户。GPUHub则专注于企业级应用,提供高可靠性、…