专题：training-methods

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

Claude大模型代码意外开源：51万行源码曝光引发行业关注

媒体InfoQ 中文2026/04/01 22:205630

• Claude代码意外泄露

• 51万行源码曝光

Claude大模型代码意外泄露，51万行源码包含架构与训练细节，引发对模型安全机制及技术透明度的讨论，为研究者提供分析商业大模型的参考。

媒体InfoQ2026/03/14 18:596840

• 训练LLM学习贝叶斯预测

• 提升多步推理更新能力

谷歌提出贝叶斯教学法，通过让LLM学习贝叶斯系统的预测结果，提升其多步交互中的推理能力。该方法改进了模型在接收新信息时更新信念的方式，具有理论深度和实验验证，对AI研究和应用有重要参考价值。

媒体Ahead of AI2024/12/31 20:217840

• 聚焦LLM领域重要研究

• 涵盖专家混合模型等技术

本文整理了2024年上半年值得关注的AI研究论文，重点聚焦于LLM领域，包括专家混合模型、训练方法和数据集等技术内容，为开发者和研究人员提供有价值的参考。