上海交大提出SIE框架:结构化上下文环境提升大模型通用推理能力原文媒体机器之心2026/02/23 20:145930上海交大提出SIE框架,利用结构化数据构建RL训练环境,提升大模型的通用推理能力。该方法在多个任务中表现优异,且具备扩展性与泛化性,无需依赖昂贵人工标注。结构化上下文环境强化学习可泛化推理知识图谱RL训练