专题:training-methods

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

媒体InfoQ2026/03/14 18:596840
训练LLM学习贝叶斯预测
提升多步推理更新能力

谷歌提出贝叶斯教学法,通过让LLM学习贝叶斯系统的预测结果,提升其多步交互中的推理能力。该方法改进了模型在接收新信息时更新信念的方式,具有理论深度和实验验证,对AI研究和应用有重要参考价值。