北大团队提出TARA方法,实现生物分层识别新突破
量子位2026/03/21 17:48机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
9/10
营销水分
5/10
摘要
北京大学彭宇新团队提出TARA方法,通过分类感知表征对齐技术,将类别树结构知识注入多模态大模型,解决了分层视觉识别中从粗到细的精准识别难题。该方法不仅提升了最终细粒度类别的识别准确率,还增强了模型对新类别的泛化能力。论文被CVPR 2026接收并开源,为生物分类和通用视觉理解提供了重要进展。
正文
本文介绍了北京大学彭宇新教授团队在细粒度多模态领域的新研究成果——分类感知表征对齐方法(TARA)。该方法通过引入类别树结构知识,解决了现有模型在分层视觉识别任务中从粗到细实现每一层精准识别的难题。具体而言,TARA包含分层视觉表征对齐和自由粒度类别表征对齐两个核心部分,通过对齐与生物基础模型的中间表征,提升了模型在iNaturalist-Plant与iNaturalist-Animal数据集上的分层识别准确率,尤其在新类别泛化方面表现突出。相关论文已被CVPR 2026接收,并已开源代码,为多模态的类别树知识注入提供了新路径。