媒体量子位2026/03/27 22:286840
• 中国大模型团队优势在于算力受限下的最优解能力
• token使用量暴增推动基础设施升级
中国大模型专家在圆桌讨论中聚焦agent技术演进、token使用量激增与算力挑战,强调开源生态、模型结构创新和基础设施优化的重要性,认为未来AI将更偏向agent-native。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 6 篇文章。
中国大模型专家在圆桌讨论中聚焦agent技术演进、token使用量激增与算力挑战,强调开源生态、模型结构创新和基础设施优化的重要性,认为未来AI将更偏向agent-native。
ONCE 是一个新的自托管应用服务器平台,整合了多个开源项目,简化了部署和运维流程。它支持监控、升级和备份,旨在为用户和 AI 代理提供完整的基础设施解决方案。
Quesma 推出了 OTelBench,这是首个用于评估 OpenTelemetry 基础设施与 AI 性能的基准测试工具。该工具通过模拟 AI 工作负载并利用 OpenTelemetry 遥测数据,量化分析 AI 模型在训练和推理阶段的资源消耗、延迟和吞吐量。OTelBench 旨在帮助开发者和运维人员优化 AI 部署,识别性能瓶颈,并指导基础设施选择…
2025年12月,AI代理技术取得多项进展。Perplexity推出Computer平台,支持任务编排与分布式处理;OpenAI发布GPT-5.3-Codex,性能提升显著;Claude Code通过生态整合实现扩展。这些发展推动了编码工作流程和代理开发模式的革新。
文章探讨了智能代理的构建与运行平台的重要性,指出平台化是AI应用落地的关键。强调了平台需具备基础设施、管理与优化功能,同时提到企业与研究机构正在加大投入,推动AI代理技术发展。
Google AI团队在最新播客中探讨了Gemini模型如何通过强大基础设施实现全球数十亿用户的部署。内容涵盖模型优化、分布式计算与用户访问策略,展示了AI技术规模化落地的实践与挑战。核心亮点在于对实际部署流程的深入解析。