专题:debugging

按该标签聚合的大模型资讯列表(自动分类与标签提取)。9 篇文章。

媒体LangChain Blog2026/03/18 23:387830
Polly全面集成LangSmith所有页面
支持跨页面对话记忆与操作执行

LangSmith 推出 Polly,一款 AI 助手,用于调试和分析 AI 代理。Polly 支持所有页面使用,具备上下文记忆和执行操作能力,可帮助用户理解用户情绪、编写评估代码、对比实验结果,提升调试效率。

官方Microsoft Research Blog2026/03/13 00:387960
AgentRx实现AI代理自动化故障诊断
包含115条手动标注失败轨迹数据集

微软发布开源AI代理调试框架AgentRx,通过自动化诊断定位关键故障步骤。该框架包含115条失败轨迹数据集和九类故障分类体系,显著提升故障定位和根本原因识别能力,助力构建更透明、可靠的AI代理系统。

社区Reddit r/LocalLLaMA2026/02/10 16:2760

作者为 OpenCode 开发了一款实时智能体执行可视化工具。该工具能实时渲染智能体的执行图,清晰展示任务并行分派、工具调用延迟、token 使用量及成本,以及智能体如何实时捕获错误并自我纠正。它将传统的终端文本输出转变为动态的决策树视图,让用户能直观地“看到”智能体的思考过程,极大地简化了调试工作,并提升了整体交互体验。目前该工具尚处于早期阶段,但已展现…