专题:simulation

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

媒体InfoQ2026/03/13 22:125820
DoorDash开发LLM对话模拟器
用于测试客户支持聊天机器人

DoorDash开发LLM对话模拟器,用于大规模测试客户支持聊天机器人。系统基于历史数据和模拟生成多轮对话,利用LLM评估表现,支持快速迭代优化。该工具提升了测试效率和系统性能,具有实际应用价值。

媒体机器之心2026/02/20 22:455820

香港大学与上海交大联合推出 AutoBio,一个专为生物实验室设计的 VLA 模型仿真与评测平台。该平台解决了现有研究中对专业科学场景(尤其是生物实验室)的 VLA 模型评估不足的问题。AutoBio 构建了高保真仿真环境,模拟了生物实验室特有的复杂操作和视觉挑战,并提供了一套标准化实验任务基准。评测结果揭示了当前主流 VLA 模型在处理高精度操作、细粒度…

媒体量子位2026/02/14 16:466840

斯坦福AI小镇团队Simile获1亿美元融资,将生成式智能体升级为大规模决策模拟平台。该平台基于“记忆流-反射-规划”架构,赋予AI智能体类人认知能力,能从25个扩展至千级智能体,通过模拟真实人群行为,为企业提供决策风险预测,充当“决策飞行模拟器”,有效降低试错成本。李飞飞、卡帕西等知名专家参与投资,标志着智能体应用进入商业化新阶段。