专题:ai-performance

按该标签聚合的大模型资讯列表(自动分类与标签提取)。7 篇文章。

媒体InfoQ 中文2026/03/05 00:004760

Quesma 推出了 OTelBench,这是首个用于评估 OpenTelemetry 基础设施与 AI 性能的基准测试工具。该工具通过模拟 AI 工作负载并利用 OpenTelemetry 遥测数据,量化分析 AI 模型在训练和推理阶段的资源消耗、延迟和吞吐量。OTelBench 旨在帮助开发者和运维人员优化 AI 部署,识别性能瓶颈,并指导基础设施选择…

媒体量子位2026/02/20 09:258750

Google 于 2026 年 2 月推出 Gemini 3.1 Pro,基于 Gemini 3 Pro 进行大幅升级:推理能力提升约 2 倍,支持 1 M token 长上下文,增强多模态生成与代码推理,并在保持原有计费的前提下实现约 10 倍成本下降。该模型已在 Gemini 应用、API 与 NotebookLM 中开放,适用于复杂可视化、长文档推理…