DashCLIP 是 DoorDash 推出的多模态AI模型,利用3200万个餐饮场景标注数据,实现图像、文本与用户查询的语义对齐。该模型显著提升菜品图像的零样本检索准确率,已应用于App内拍照搜菜功能。其核心亮点在于构建了大规模垂直领域标注数据集,并通过对比学习优化餐饮语义空间,为行业提供可复用的多模态搜索范式。
专题:semantic-search
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 6 篇文章。
媒体InfoQ 中文2026/03/24 19:004840
• DoorDash发布DashCLIP模型用于餐饮图像语义搜索
• 模型训练使用3200万个人工标注的图像-文本对
媒体InfoQ2026/03/16 22:256730
• 多模态对齐提升搜索效果
• 3200万标注数据训练模型
DoorDash推出DashCLIP多模态系统,通过3200万标注数据对齐图像、文本和查询,提升语义搜索、产品排序和广告相关性。该系统基于对比学习,适用于市场平台的多种机器学习任务。
媒体Latent Space2026/03/13 06:566850
• 优化语义搜索与推荐功能
• 结合存储成本降低搜索成本
Turbopuffer是一款基于AI的搜索引擎,旨在优化语义搜索和文章推荐功能。通过结合搜索与数据存储成本,实现高性能与低成本的平衡。其创新点包括混合搜索技术、智能代理设计和严格的团队筛选标准,适用于AI搜索领域的开发者和研究者。
社区Reddit r/LocalLLaMA2026/02/22 17:382730
本文介绍了一个创新的AI桌面宠物构想,旨在通过结合大型语言模型与本地语义搜索技术,解决传统AI记忆短暂的问题。该项目计划使用Love2D构建2D桌面精灵,以Gemini API作为“大脑”,并集成Rust开发的`rememex`工具作为“记忆”模块。通过Python后台脚本,宠物将能够读取并理解用户本地的笔记、PDF和代码文件,从而提供个性化、上下文感知的…
官方Microsoft Azure Blog2026/02/13 00:007850
• Pantone用AI代理优化调色板生成
• Azure Cosmos DB支撑实时数据交互
Pantone利用Azure Cosmos DB构建了基于AI代理的调色板生成工具,实现动态、实时的色彩推荐。该系统通过多智能体协作和上下文感知,将专业色彩知识转化为可交互的AI体验。实际应用显示其在全球范围内获得广泛使用,展示了AI与创意工作的结合潜力。
社区Reddit r/LocalLLaMA2026/02/11 13:0230
该项目展示了一个名为 EpsteinFiles-RAG 的 RAG(检索增强生成)管道的构建过程,该管道能够处理超过 200 万页的文档数据。项目详细介绍了数据清洗、分块、向量化以及在此基础上实现的语义搜索和问答功能。通过对 RAG 各个环节的优化,旨在提升大规模数据集上的信息检索和问答性能。该项目使用 Python 开发并开源,为处理海量非结构化数据提供…