首页/详情

ReCALL框架:解决生成式与判别式范式冲突,提升多模态检索性能

量子位2026/04/06 23:30机翻/自动摘要/自动分类
1 阅读

内容评分

技术含量
9/10
营销水分
7/10

摘要

ReCALL框架通过‘诊断-生成-校准’闭环解决生成式与判别式范式冲突,显著提升多模态图像检索性能,已在CVPR 2026录用,刷新CIRR和FashionIQ数据集的SOTA表现。

正文

ReCALL框架由紫东太初团队与新加坡国立大学联合提出,旨在解决多模态(MLLM)在图像检索任务中因范式冲突导致的能力退化问题。该框架采用‘诊断-生成-校准’的闭环体系,通过四个阶段逐步优化检索器性能。首先进行基础检索适配,然后利用模型自我诊断找出错误样本,再通过生成校正指令进行精准修改,最后通过对比学习打磨模型。实验结果显示,ReCALL在CIRR和FashionIQ等主流数据集上全面刷新SOTA性能,尤其在细粒度检索任务中表现突出。该成果已被CVPR 2026正式录用,为多模态在垂直领域的落地提供了重要支持。

标签