专题：vector-database

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 10 篇文章。

可调式 RAG 框架的设计与开源抉择

社区Reddit r/LocalLLaMA2026/02/22 18:112640

作者在业余时间构建了一个高度模块化、可自动调优的 RAG 系统，涵盖数据分块、检索、重排和生成四大环节，并实现了向量库可插拔、贝叶斯网格搜索调参等特性。文中阐述了系统设计动机、已实现功能、未来规划以及当前缺乏数据工程和 DevOps 支持的瓶颈，并就开源时机、合作方式和功能优先级向社区求助。

检索增强生成模块化架构向量数据库自动调优开源项目

Zvec：轻量级内进程向量数据库，为LLM应用提供极速本地检索

原文

社区Hacker News2026/02/13 16:5340

Zvec 是一个轻量级、内嵌式向量数据库，专为 LLM 应用优化，支持在进程内直接进行高速向量存储与检索，无需独立服务。其核心优势在于极低的内存开销、毫秒级响应速度和零依赖部署，特别适合边缘计算、本地 RAG 和资源受限环境。开源且提供简洁 API，显著降低向量检索的集成门槛。

向量数据库 LLM模型嵌入式数据库检索增强生成轻量级

数据驱动的自主式AI：Pantone如何借助Azure Cosmos DB实现智能调色板生成

原文

官方Microsoft Azure Blog2026/02/13 00:007850

• Pantone用AI代理优化调色板生成

• Azure Cosmos DB支撑实时数据交互

Pantone利用Azure Cosmos DB构建了基于AI代理的调色板生成工具，实现动态、实时的色彩推荐。该系统通过多智能体协作和上下文感知，将专业色彩知识转化为可交互的AI体验。实际应用显示其在全球范围内获得广泛使用，展示了AI与创意工作的结合潜力。

代理型AI Azure Cosmos DB 调色板生成器实时数据语义搜索

高效存储与查询文本嵌入：Parquet与Polars的实战应用

原文

官方Minimaxir2025/02/25 02:156830

文章探讨了文本嵌入的高效存储与查询方法，推荐使用Parquet和Polars处理嵌入数据。通过对比传统格式，突出了其在性能、体积和元数据管理上的优势，并展示了实际应用案例。

Parquet格式 Polars库文本嵌入 UMAP 可视化向量数据库

Qdrant批量上传内存优化指南

原文

官方Qdrant Blog2025/02/13 08:003830

本文探讨Qdrant中批量上传向量数据的内存优化方法，涵盖密集型与稀疏型向量处理，旨在提升系统性能并避免内存不足问题。核心亮点包括分批处理、参数配置优化和数据格式调整。

Qdrant 向量数据库内存优化批量上传稀疏向量

Qdrant 自研键值存储 Gridstore：为何放弃 RocksDB

原文

官方Qdrant Blog2025/02/05 08:004740

Qdrant 自研键值存储 Gridstore，替代原有 RocksDB。核心亮点包括优化延迟、简化配置、提升性能。适用于向量数据库场景，是 Qdrant 在存储架构上的重要改进。

Gridstore RocksDB 键值存储向量数据库存储引擎

向量数据库：AI时代非结构化数据的存储新方案

原文

官方Qdrant Blog2024/10/09 20:295730

向量数据库用于存储和管理非结构化数据，通过向量化技术支持AI、机器学习和搜索引擎的高效处理。其核心亮点在于对高维数据的快速相似性检索和可扩展性。

向量数据库人工智能机器学习搜索引擎数据存储

基于评估的RAG技术优化方法解析

原文

官方Qdrant Blog2024/06/12 08:005720

本文介绍基于评估的RAG技术优化方法，通过结合知识库与LLMs提升生成内容的准确性与时效性。核心亮点在于利用评估机制改进信息检索与生成过程，减少错误和不相关输出。

检索增强生成 LLM模型向量数据库知识管理系统评估方法

Qdrant 1.8.0 发布：性能优化与稀疏向量处理增强

原文

官方Qdrant Blog2024/03/06 16:005830

• 稀疏向量处理速度提升16倍

• 支持灵活的CPU线程分配

Qdrant 1.8.0 发布，重点优化了稀疏向量处理和索引性能，显著提升搜索吞吐量。适用于AI/LLM应用，增强系统效率与资源利用率，是向量数据库技术的重要进展。

向量搜索稀疏向量索引优化 AI基础设施 LLM工具

Qdrant 多租户与自定义分片：构建可扩展的机器学习系统

原文

官方Qdrant Blog2024/02/06 21:215740

Qdrant 通过多租户和自定义分片技术，帮助用户扩展机器学习系统。该方案适用于多种场景，如欺诈检测、RAG 和政府服务，能提升性能并降低成本。文章介绍了实现方法，具有实际参考价值。

Qdrant 向量数据库分布式部署多租户检索增强生成