专题:vqa

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

媒体机器之心2026/02/13 17:0250

SSI-Bench是一个基于约束流形的空间智能评估基准,旨在检验多模态大模型在复杂三维结构推理中的能力。通过人工构建的1,000道排序题,该基准揭示了当前模型在三维结构识别和约束推理上的显著不足,人类表现远超AI。其核心亮点在于结合结构工程知识,提供更贴近现实的评测环境。