专题:ai_safety

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

官方OpenAI Blog2026/03/24 19:006750
OpenAI发布青少年安全AI政策工具
帮助开发者管理AI系统中的青少年风险

OpenAI推出青少年安全AI政策工具,供开发者参考,帮助管理与青少年相关的AI风险。该工具涵盖内容过滤、隐私保护和行为引导,旨在提升AI在青少年群体中的安全性。政策基于提示机制,适用于GPT-OS-Safeguard系统,是AI伦理治理的重要实践。

媒体Import AI2025/11/10 21:306830

本期《人工智能进口》探讨了语言模型信念变化、AI安全训练方法、超级智能的地缘政治风险及AI人格的法律定义。研究指出模型可通过对话或上下文调整信念,BCT方法能有效减少破解风险,而Conjecture警告超级智能可能引发全球性灾难。AI人格的实用主义定义为法律整合提供了新思路。