专题:retrieval-augmented-generation

按该标签聚合的大模型资讯列表(自动分类与标签提取)。12 篇文章。

官方AWS Machine Learning Blog2026/03/30 23:296820
多语言RAG系统构建
成本降低21%

Ring利用Amazon Bedrock Knowledge Bases构建多语言RAG聊天机器人,通过元数据过滤和分阶段架构实现全球支持扩展。该方案降低21%扩展成本,确保10个国际地区客户体验一致性,涵盖向量存储、版本管理、灾难恢复等关键技术要素。

媒体ByteByteGo Newsletter2026/03/23 23:315850
引入智能代理优化查询流程
支持多源信息整合与评估

Agentic RAG 是一种引入智能代理的检索增强生成技术,通过自主决策、查询优化和结果评估提升系统性能与准确性。其核心亮点在于多源信息处理、动态查询调整和自我修正能力,适用于复杂任务场景,但需权衡成本与效率。

媒体Latent Space2026/03/13 06:566850
优化语义搜索与推荐功能
结合存储成本降低搜索成本

Turbopuffer是一款基于AI的搜索引擎,旨在优化语义搜索和文章推荐功能。通过结合搜索与数据存储成本,实现高性能与低成本的平衡。其创新点包括混合搜索技术、智能代理设计和严格的团队筛选标准,适用于AI搜索领域的开发者和研究者。

社区Reddit r/LocalLLaMA2026/02/23 20:135740

本文探讨了在AI检索系统中直接嵌入时间性属性的必要性,并介绍了一篇提出将时间性作为MRL(Memory-Based Retrieval)表示子空间处理的2026年论文。作者希望了解该方法在实际应用中的效果,尤其是在处理包含“上周”、“昨天”等时间关键词的查询时,能否提升检索性能。同时,也征集大家在实际场景中解决时间性查询的经验。

社区Reddit r/LocalLLaMA2026/02/21 20:582540

本文系统梳理了 AI 代理常用的记忆实现方案,包括向量库(FAISS、Chroma、Pinecone 等)、专用记忆框架(SuperMemory、OpenMemory 等)以及传统数据库+向量库的混合模式,并对各自的原理、优缺点和适用场景进行对比。通过社区使用数据,指出约 68% 的开源项目采用成熟向量库,只有少数尝试新兴框架。针对长期对话、知识检索、任务…

社区Reddit r/LocalLLaMA2026/02/09 23:0330

在 RAG 应用中,静态分块常引发上下文裁剪问题。本文探讨了查询感知分块和动态窗口方案,该方案能在检索时自适应调整,更适合长文档处理。作者寻求社区关于此方案的实际实现经验、性能基准测试、延迟权衡及潜在挑战的分享,并引用了 AI21 Labs 的相关研究作为参考。

官方Qdrant Blog2024/11/22 08:004720

Agentic RAG是结合代理机制与RAG技术的新型方法,通过非线性流程提升问题解决能力。它利用LLM作为决策核心,结合向量数据库等工具,实现更灵活、智能的交互。适用于需要复杂推理和动态决策的场景,对开发者和研究者具有重要参考价值。

官方Qdrant Blog2024/03/19 20:294740

RAG通过整合外部信息检索,提升大模型生成内容的准确性和相关性。它让模型在预训练知识之外获取实时数据,从而增强其应对复杂任务的能力。该技术是当前LLM领域的重要发展方向,有助于解决模型知识过时和泛化能力不足的问题。