专题：model_security

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

优化大型语言模型指令层级结构以提升安全性

官方OpenAI Blog2026/03/10 19:006830

• 优化指令执行优先级

• 提升模型安全性

IH-Challenge项目通过优化LLM的指令层级结构，提升模型安全性与抗提示注入攻击能力。其核心在于训练模型优先执行可信指令，从而增强系统可控性与交互可靠性。

媒体AINews2026/02/24 13:447820

• Anthropic指控多家公司进行蒸馏攻击

• 模型安全与API滥用防御成焦点

Anthropic指控DeepSeek、Moonshot AI和MiniMax进行大规模蒸馏攻击，试图窃取Claude模型能力。事件引发对模型安全和竞争风险的讨论，同时涉及API滥用防御、编程辅助工具应用及OpenClaw生态扩展等技术议题。

媒体AINews2026/02/24 13:447840

Anthropic指控DeepSeek、Moonshot和MiniMax进行工业级数据蒸馏攻击，引发行业对模型能力复制与知识产权保护的讨论。文章涵盖技术争议、社区反应、安全影响及AI领域其他技术动态，具有较高的技术参考价值。