首页/详情

LangSmith Agent Builder 记忆系统深度剖析:文件化持久化与多模记忆实现

LangChain Blog2026/02/22 11:55机翻/自动摘要/自动分类
2 阅读

内容评分

技术含量
7/10
营销水分
5/10

摘要

LangSmith Agent Builder 通过文件化的虚拟文件系统实现了程序性和语义记忆,使得零代码代理能够在重复任务中持续学习并自动更新指令。文章详细阐述了记忆文件的组织、实现细节、实际案例以及开发过程中的关键经验,并展望了情景记忆和语义检索的未来方向。

正文

什么是 LangSmith Agent Builder

LangSmith Builder 是一款 零代码 智能代理构建平台,基于 LangChain 的 Deep Agents 框架实现。它面向技术门槛较低的用户,帮助他们快速搭建如邮件助理、文档检索等特定任务的代理。

为何优先开发记忆系统

在通用(ChatGPT、Claude、Cursor)中,用户的交互往往千差万别,记忆的价值有限。LangSmith Builder 的代理则 重复执行同一业务流程,因此一次交互中获得的经验可以直接迁移到后续交互。若没有记忆,用户每次都要重复提供相同的上下文,使用体验会急剧下降。

根据 COALA 论文的记忆划分,本文将记忆系统分为三类:

  • 程序性记忆:指导代理行为的规则集合;
  • 语义记忆:关于外部世界的事实信息;
  • 情景记忆:代理过去行为的序列(本系统暂未实现)。

记忆系统的实现方式

  1. 文件化存储:记忆以文件形式保存(markdown、json),因为 对文件系统的理解最为自然。代理可以直接读取、编辑这些文件,无需额外工具。
  2. 虚拟文件系统:实际文件保存在 PostgreSQL 中,由 DeepAgents 提供的抽象层映射为文件系统,支持 S3、MySQL 等后端。
  3. 标准化文件
    • AGENTS.md:核心指令集(程序性记忆)。
    • tools.json:工具访问权限配置(程序性记忆)。
    • subagents/ 目录:子代理定义,采用类似 Claude Code 的格式。
    • 其他用户自定义的 markdown/json 文件:用于存放语义记忆(如候选人信息、会议摘要等)。

典型案例:LinkedIn 招聘代理

  • AGENTS.md 定义招聘流程的总体指令;
  • subagents/linkedin_search_worker 负责筛选候选人;
  • tools.json 授权对 LinkedIn 搜索 API 的调用;
  • 额外的 markdown 文件记录每轮面试的要点、候选人背景等。

编辑机制示例

  1. 初始:用户在 AGENTS.md 中写入 "使用项目符号列出会议要点"。
  2. 第一周:代理生成会议摘要并保存为 meeting_2024-02-01.md
  3. 第二周:用户再次请求摘要,代理自动读取并在原文件上追加最新要点。
  4. 迭代:用户通过自然语言指令 AGENTS.md,代理即时生效。

开发经验教训

  • 提示设计至关:记忆功能的可靠性主要取决于提示的结构与明确性。
  • 文件格式校验tools.json 必须符合 JSON Schema,否则会导致工具调用失败。
  • 代理的文件管理能力有限:它能写入信息,却不擅长主动整理或删除冗余内容,需要显式提示。
  • 显式指令仍必不可少:即便记忆可自动更新,关键操作仍需用户明确指令。

记忆系统带来的价值

  • 零代码体验:通过 markdown 与 json,非技术用户即可管理记忆。
  • 迭代式构建:用户只需自然语言反馈,代理即可自我调整。
  • 跨平台迁移:完整的文件目录即可在其他 LangChain 环境中复用。

未来路线

  • 引入 情景记忆(行为序列追踪)。
  • 优化后台记忆同步与冲突解决机制。
  • 提供语义向量检索,提升对大规模事实记忆的查询效率。

如果你想亲自体验带记忆的零代码代理,访问 LangSmith Agent Builder。想参与开发或加入团队,请查看我们的 招聘信息

标签