专题：model_training

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 4 篇文章。

AI研发模式转型：海量Token成为研究标配

媒体InfoQ 中文2026/03/27 02:206850

• Token数量成为模型训练关键指标

• 传统数据标注被Token化处理取代

文章分析了AI研发模式向依赖海量Token转变的趋势，探讨了Token在模型训练中的作用，指出其对性能提升的重要性，并展望了未来AI开发的方向。

媒体Sean Goedecke2026/03/03 08:004730

• LLM人格化是实用AI的关键

• 基础模型需人格引导

本文探讨了大型语言模型（LLM）人格化设计的重要性，指出赋予模型个性是提升其实用性和伦理安全性的关键。文章反驳了AI不应像人类的观点，认为这是构建强大AI系统的核心方法，并引用了Anthropic和OpenAI的模型作为实例。核心亮点在于强调人格化是技术实践而非哲学错误。

媒体AINews2026/02/24 13:447840

Anthropic指控DeepSeek、Moonshot和MiniMax进行工业级数据蒸馏攻击，引发行业对模型能力复制与知识产权保护的讨论。文章涵盖技术争议、社区反应、安全影响及AI领域其他技术动态，具有较高的技术参考价值。

媒体Hugging Face Blog2026/01/28 08:007630

Claude 被用于生成 CUDA 内核并训练开源模型，展示了 AI 在底层编程和模型优化中的潜力。该方法提升了并行计算效率，为高性能计算提供了新思路。