专题:optimal-control

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

社区Hacker News2026/03/30 15:344640
HJB方程是强化学习的核心数学工具
扩散模型在生成任务中表现突出

哈密尔顿-雅可比-贝尔曼方程是强化学习的核心工具,用于求解最优策略。扩散模型作为生成模型的重要方向,与HJB方程结合可能带来新应用。文章简要介绍了两者的基本概念及其潜在关联,具有一定的技术参考价值。