专题:observability

按该标签聚合的大模型资讯列表(自动分类与标签提取)。25 篇文章。

媒体InfoQ 中文2026/04/01 18:005830
AI优化日志分析效率
Commit管理实现自动化

蓝鲸平台通过AI技术优化全链路可观测性,重点应用于日志分析和Commit管理。采用深度学习模型实现日志分类与异常检测,结合NLP技术解析Commit信息,提升运维效率与问题定位准确性。核心亮点包括自动化根因分析系统和时序数据预测算法的工程化应用。

媒体LangChain Blog2026/04/01 01:007940
MongoDB成为AI代理统一后端
集成RAG与状态持久化功能

LangChain与MongoDB合作推出深度集成方案,将AI代理开发所需的关键功能(如向量搜索、状态持久化、自然语言查询)整合至MongoDB平台。通过统一数据层和多云兼容性,企业可直接在现有数据库基础上构建生产级AI代理,无需额外基础设施。该方案包含实际应用案例,支持RAG、全栈追踪等技术,为开发者提供端到端解决方案。

媒体LangChain Blog2026/03/27 22:006840
手动审查跟踪记录建立基准
区分能力评估与回归评估

本文为AI代理评估提供了一套系统性准备清单,涵盖手动审查、评估级别选择、数据集构建等关键步骤。强调通过跟踪记录建立基准,区分能力与回归评估,并确保评估的可解释性与针对性。适用于开发者和研究人员构建和优化代理评估体系。

媒体LangChain Blog2026/03/24 05:377850
LangChain展示AI代理生态与技术实践
LangSmith上线Google Cloud Marketplace

LangChain在Google Cloud Next 2026展示其AI代理生态,包括LangSmith的最新功能、技术讨论和社交活动。重点聚焦于高并发、零信任隔离和开发人员体验优化,为AI应用构建者提供实践参考。

媒体InfoQ 中文2026/03/20 17:554830
智能体需设计状态管理以维持多轮对话一致性
工具调用需安全集成外部系统并处理失败重试

本文系统梳理了AI智能体从原型到生产部署的工程路径,涵盖状态管理、工具调用、可观测性与成本控制等核心议题。作者以LangChain和AutoGen为例,揭示智能体落地的关键在于工程鲁棒性而非模型性能,强调可观测性与错误恢复机制是生产级智能体的基石,为开发者提供可复用的架构思路。

媒体LangChain Blog2026/03/20 00:497830
支持企业级代理创建与管理
提供分层权限与多认证模式

LangSmith Fleet 是一个企业级智能代理管理平台,支持代理创建、共享、权限控制和行为追踪。其核心亮点包括分层权限管理、多认证模式、Slack 集成和统一收件箱,适用于团队协作和自动化任务管理,提升运营效率与安全性。

媒体Martin Fowler2026/03/19 23:574820
代码审查不止是找漏洞
AI提升审查的判断能力

文章探讨代码审查的真正价值,指出其不仅是漏洞检测,更是方向引导和团队沟通。作者强调AI可提升审查的判断能力,使开发者关注更高层次问题。同时,讨论了生产环境的观察与AI对人类认知的影响,具有深度的软件工程与AI结合思考。

媒体AWS Machine Learning Blog2026/03/13 05:206840
新增CloudWatch指标用于监控AI推理延迟
提供实时配额使用估算,避免流量限制

AWS在Amazon Bedrock中新增了两个CloudWatch指标,用于实时监控推理延迟和配额使用。`TimeToFirstToken`反映生成第一个令牌的时间,`EstimatedTPMQuotaUsage`提供更准确的配额消耗估算。这些指标无需配置,自动收集,适用于多种API,有助于性能优化和容量管理。

媒体AINews2026/03/12 13:446830
MCP协议在实际应用中仍具关键作用
CursorBench评估模型智能与效率

本文聚焦AI代理技术中的资源管理、MCP协议及评估工具,探讨其对UI/UX和运行时环境的影响。重点包括CursorBench的智能评估、GPT-5.4的高效表现,以及Hermes Agent v0.2.0对MCP协议的支持与扩展集成能力。

官方Microsoft Azure Blog2026/03/10 02:116550
微软推出代理式AI播客
探讨数据与云平台挑战

微软推出《The Shift》播客,系统解析代理式AI技术生态。通过讨论数据统一、云平台扩展、跨系统协作等核心议题,结合Microsoft Fabric、OneLake等产品实践,为开发者提供技术洞察。播客聚焦实际应用挑战,如RAG技术边界、数据库需求及安全治理,旨在推动AI代理技术落地。

媒体InfoQ 中文2026/03/05 00:004760

Quesma 推出了 OTelBench,这是首个用于评估 OpenTelemetry 基础设施与 AI 性能的基准测试工具。该工具通过模拟 AI 工作负载并利用 OpenTelemetry 遥测数据,量化分析 AI 模型在训练和推理阶段的资源消耗、延迟和吞吐量。OTelBench 旨在帮助开发者和运维人员优化 AI 部署,识别性能瓶颈,并指导基础设施选择…

媒体AWS Machine Learning Blog2026/02/21 04:265670

2025年,Amazon SageMaker AI在模型训练、调优和托管方面取得了显著进展。本文重点介绍了其在可观测性、模型定制和托管功能上的深度升级。通过引入细粒度指标,用户可精准诊断性能瓶颈和资源浪费,并利用CloudWatch实现主动监控与自动响应。无服务器模型定制简化了调优流程,支持RLVR/RLAIF等高级技术,并兼容主流模型。此外,双向流、IP…

媒体LangChain Blog2026/02/13 10:235660

本文深入探讨了AI代理框架的演进,从LangChain的链式执行到LangGraph的编排运行时,再到DeepAgents的强化功能。文章强调,代理框架虽需与LLM同步发展,但其在加速开发、标准化代码方面仍具核心价值。同时,无论采用何种框架,代理的可观测性都至关重要,LangSmith作为独立于开源框架的工具,为代理的追踪、调试与优化提供了关键支持。