专题：diffusion-models

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 9 篇文章。

哈密尔顿-雅可比-贝尔曼方程在强化学习与扩散模型中的应用

原文

社区Hacker News2026/03/30 15:344640

• HJB方程是强化学习的核心数学工具

• 扩散模型在生成任务中表现突出

哈密尔顿-雅可比-贝尔曼方程是强化学习的核心工具，用于求解最优策略。扩散模型作为生成模型的重要方向，与HJB方程结合可能带来新应用。文章简要介绍了两者的基本概念及其潜在关联，具有一定的技术参考价值。

强化学习扩散模型哈密尔顿-雅可比-贝尔曼方程最优控制人工智能理论

TADA：基于文本-声学同步的高效语音生成技术

原文

社区Hacker News2026/03/11 13:425830

• 文本与声学同步生成语音

• 提升生成速度与质量

TADA是一种基于文本-声学同步的语音生成技术，利用扩散模型提升语音合成的效率与质量。其核心亮点在于文本与声学特征的对齐机制，适用于多语言场景，具有较高的实用价值。

扩散模型文本到语音声学同步语音生成机器学习

PRX 系列第三篇：24小时极速挑战，从零训练文本到图像生成模型实战

原文

媒体Hugging Face Blog2026/03/04 00:506840

本文是PRX系列第三部分，深入探讨了在24小时内从零开始训练一个文本到图像生成模型的实战路径。文章详细介绍了如何通过优化策略，如利用预训练组件、高效数据处理、混合精度训练以及Hugging Face Accelerate等工具，大幅缩短模型训练周期。它不仅提供了关键的技术指导和代码示例，还强调了在追求速度的同时，如何平衡模型性能与资源消耗。对于希望快速掌握…

文本到图像扩散模型模型训练 HuggingFace Accelerate

Max Welling与CuspAI：AI驱动的材料发现与“物理处理单元”

原文

媒体Latent Space2026/02/26 01:365820

Max Welling教授在视频中探讨了CuspAI如何利用AI加速材料发现，提出“实验即计算”和“物理处理单元”概念。CuspAI平台整合生成模型、数字孪生与自动化实验循环，旨在赋能化学家。视频深入分析了等变神经网络、扩散模型与随机热力学，强调材料是AI和能源转型的关键瓶颈。CuspAI获1亿美元A轮融资，汇聚顶尖顾问，致力于AI for Science。

AI for Science 材料发现等变神经网络扩散模型物理处理单元

CineTrans：基于掩码机制的多镜头视频生成模型，实现时间级可控转场

原文

媒体机器之心2026/02/15 18:325940

CineTrans 是一种基于掩码机制的多镜头视频生成模型，通过块对角掩码架构实现时间级可控转场。它结合了扩散模型与注意力机制，引入了高质量的 Cine250K 数据集，提升了多镜头视频生成的自然性和语义连贯性。该模型在 ICLR 2026 接收，具备较强的实验支撑和实际应用价值。

扩散模型注意力机制优化掩码技术多镜头视频生成 Cine250K 数据集

自建 144GB VRAM 训练平台：6x RTX 3090 助力 10B 参数扩散模型从零训练

原文

社区Reddit r/LocalLLaMA2026/02/11 18:2850

本文介绍了一个为训练大型扩散模型而构建的定制化 AI 硬件平台。该平台集成了 6 块 RTX 3090 GPU，总计 144GB VRAM，并采用了 Epyc CPU 和八通道 DDR4 内存。通过优化驱动和启用 GPU P2P 功能，实现了高效的 GPU 间通信。该平台专为从零开始训练高达 100 亿参数的扩散模型而设计，展示了在 AI 模型训练领域对高…

AI计算硬件扩散模型 GPU训练深度学习 TinyGrad框架

LWiAI 225期：GPT-5.1、ERNIE 5.0与AI驱动的远程工作变革

原文

媒体Last Week in AI2025/11/22 16:277660

本期LWiAI播客聚焦GPT-5.1、ERNIE 5.0等大模型更新，以及AI在自动驾驶、内容创作、远程工作自动化等领域的应用进展。特别关注AI生成音乐和声音的市场趋势，并探讨了AI对劳动力结构的影响。内容涵盖技术发布、产品落地与行业动态，信息量大且具有参考价值。

AI模型扩散模型远程工作合成媒体 AI助手

Sora 2：视频生成技术迈入更真实的新阶段

原文

媒体AI Explained (YouTube)2025/10/01 23:008740

Sora 2 是 OpenAI 推出的视频生成模型升级版，显著提升视频逼真度与生成质量。通过优化算法和引入物理模拟技术，支持更长视频和复杂场景交互，为内容创作带来新可能。

视频生成扩散模型 AI创意 OpenAI 深度学习

2025年上半年LLM研究论文精选：按主题分类的深度解析

原文

媒体Ahead of AI2025/07/01 19:116820

• 按主题分类LLM研究论文

• 涵盖推理模型与强化学习方法

本文整理了2025年上半年与LLM相关的研究论文，按主题分类，重点聚焦推理模型、强化学习和多模态模型等方向。内容涵盖训练策略、推理优化方法及数据集研究，具有较高的技术参考价值，并附带夏季学习资源。

大语言模型推理模型强化学习高效训练多模态模型