专题：ai-performance

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 7 篇文章。

面向代理工作流的SOTA嵌入模型公开预览

原文

官方Databricks Blog2026/03/18 04:307820

• 新嵌入模型专为代理工作流优化

• 提升复杂任务处理效率与准确性

最新SOTA嵌入模型专为代理工作流设计，公开预览。通过优化信息表示，提升AI系统处理复杂任务的效率与准确性，适用于多步骤任务的语义理解和执行。

代理工作流嵌入模型 AI性能信息检索 SOTA性能

苹果M5 Max MacBook Pro AI性能惊艳｜专业评测

原文

媒体爱范儿2026/03/10 13:557830

• M5 Max性能超预期

• AI模型运行效率高

苹果M5 Max MacBook Pro在5万元价位上表现出色，尤其在AI任务中性能远超预期。其搭载的M5 Max处理器和Studio Display XDR显示器，为专业用户提供了高效且便携的解决方案，统一内存架构优化了本地AI模型的运行效率。

AI性能 MacBook Pro 统一内存架构 GPU 高带宽内存

OTelBench：首个 OpenTelemetry AI 性能基准测试工具发布，助力评估 AI 基础设施效率

原文

媒体InfoQ 中文2026/03/05 00:004760

Quesma 推出了 OTelBench，这是首个用于评估 OpenTelemetry 基础设施与 AI 性能的基准测试工具。该工具通过模拟 AI 工作负载并利用 OpenTelemetry 遥测数据，量化分析 AI 模型在训练和推理阶段的资源消耗、延迟和吞吐量。OTelBench 旨在帮助开发者和运维人员优化 AI 部署，识别性能瓶颈，并指导基础设施选择…

AI性能 OpenTelemetry 基准测试全栈可观测性基础设施

Elastic Cloud正式支持AWS Graviton4 ARM硬件配置

原文

官方Elastic Blog2026/02/23 08:006710

Elastic Cloud支持AWS Graviton4 ARM实例，提供性能与成本的显著提升。ARM架构优化对AI计算环境有积极影响，属于云服务与AI基础设施结合的重要进展。

AWS Graviton4 ARM架构云基础设施 Elastic Cloud AI性能

Google Gemini 3.1 Pro 正式发布：推理性能提升 2 倍，支持 1M 上下文与多模态

原文

媒体量子位2026/02/20 09:258750

Google 于 2026 年 2 月推出 Gemini 3.1 Pro，基于 Gemini 3 Pro 进行大幅升级：推理能力提升约 2 倍，支持 1 M token 长上下文，增强多模态生成与代码推理，并在保持原有计费的前提下实现约 10 倍成本下降。该模型已在 Gemini 应用、API 与 NotebookLM 中开放，适用于复杂可视化、长文档推理…

Gemini 模型 Google AI 大语言模型多模态AI AI性能