首页/详情

pg_textsearch 1.0 发布:高性能、开源的 PostgreSQL BM25 全文搜索扩展

Hacker News2026/04/01 00:29机翻/自动摘要/自动分类
2 阅读

内容评分

技术含量
8/10
营销水分
4/10

摘要

Tiger Data 开源了 PostgreSQL 的 BM25 全文搜索扩展 pg_textsearch 1.0,基于现代开发工具高效实现,性能超越 ParadeDB/Tantivy(最高 4.7 倍),采用 PostgreSQL 许可证,支持云原生混合搜索。

正文

Tiger Data 是一家专注于时间序列数据的 PostgreSQL 云服务提供商。为拓展 AI 相关业务,团队在已有的向量搜索扩展 pgvectorscale 基础上,亟需补充一套可扩展的关键词相关性排序能力——即基于 BM25 算法的全文搜索功能。

传统方案面临两大瓶颈:PostgreSQL 核心不原生支持;主流扩展 ParadeDB 采用 AGPL 许可证,限制商业集成;而自研方案曾被预估需 6–12 个月、需团队协作,且未必能达到 ParadeDB/Tantivy 的性能水平。

得益于现代开发工具(如 Claude Code、Opus)与作者 25 年数据库系统经验的结合,项目实际仅耗时两个季度即完成。pg_textsearch 1.0 已以 PostgreSQL 许可证开源,免费提供,并集成于 Tiger Data 云平台。

在 MS-MARCO 基准测试中,该系统不仅达到 ParadeDB/Tantivy 的查询性能,更在大规模查询场景下实现 4.7 倍性能提升。技术架构与测试脚本已开源(GitHub),欢迎社区共建。

标签