AutoBio:首个生物实验室 VLA 模型仿真与评测平台,揭示当前模型能力边界
内容评分
摘要
香港大学与上海交大联合推出 AutoBio,一个专为生物实验室设计的 VLA 模型仿真与评测平台。该平台解决了现有研究中对专业科学场景(尤其是生物实验室)的 VLA 模型评估不足的问题。AutoBio 构建了高保真仿真环境,模拟了生物实验室特有的复杂操作和视觉挑战,并提供了一套标准化实验任务基准。评测结果揭示了当前主流 VLA 模型在处理高精度操作、细粒度视觉推理和长期实验流程建模方面的局限性,为推动机器人自动化在科研领域的应用奠定了基础。
正文
香港大学 MMLAB 罗平教授团队与上海交大穆尧教授团队联合推出 AutoBio,一个专为数字化生物实验室设计的机器人仿真系统与基准测试平台。该工作已被 ICLR 2026 接收,旨在系统性评估当前主流视觉-语言-动作(VLA)模型在真实生物实验室环境中的实验流程执行能力。
研究背景:生物实验室的独特挑战
生物实验室环境对机器人自动化提出了严峻挑战,主要体现在:
- 长时序与强约束的实验流程:实验步骤顺序和状态依赖性极高。
- 精细机械结构的交互:螺纹、卡扣等结构对姿态控制和轨迹规划要求极高。
- 复杂视觉感知:透明容器、液体样本以及数字界面的识别与交互难度大。
这些因素使得在家庭或工业场景表现良好的模型在实验室环境中可能失效,现有基准难以反映真实能力边界。
AutoBio 的核心设计思想
AutoBio 以生物实验语义为中心,将复杂操作抽象为“生物实验原语”(如样本转移、混合反应),并映射为机器人控制模块。系统包含三部分:
- 高保真仿真系统:模拟真实实验室环境。
- 标准化实验任务基准:覆盖不同难度等级的实验任务。
- VLA 模型接口:支持数据生成、训练与评测。
仿真系统亮点
- 实验仪器的数字化建模:采用 3D Gaussian Splatting 和 CAD 建模,实现高保真几何与外观表示,兼顾视觉真实性与物理可交互性。
- 实验室专用物理机制:扩展了螺纹结构、分档旋钮、偏心机构、液体液面建模等,以更准确地反映实验操作的物理约束。
- 面向视觉模型的渲染:采用基于物理的渲染(PBR)管线,提升透明材料、液体和仪器表面的视觉真实性;支持仪器数字界面的动态渲染,使机器人能读取参数和识别状态。
AutoBio Benchmark
构建了包含 16 个任务的基准,分为简单(如开关盖)、中等(如拧开离心管、样本转移)和困难(如读取屏幕参数并调节设备)三个难度等级。每个任务均支持自动化专家轨迹生成、随机化初始条件和统一的成功判定机制。
当前模型的能力边界
评测结果显示,主流开源 VLA 模型在简单任务上表现良好,但在涉及高精度装配、液体判断或屏幕读数等任务时成功率显著下降。失败多源于细节误差累积,而非任务理解错误。这凸显了当前模型在高精度操作、细粒度视觉推理和长期实验流程建模方面的不足。
总结
AutoBio 提供了一个面向生物实验室的统一仿真与评测框架,为通用机器人走向科研自动化提供了坚实起点。随着 VLA 模型的发展,AutoBio 有望成为连接机器人学习与生命科学自动化的重要基础设施。