专题：llm-safety

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

AI安全新基准与科学局限：中国ForesightSafety Bench发布，核能LLM战略行为引关注

媒体Import AI2026/02/23 21:315730

本文聚焦AI前沿动态，重点介绍了中国发布的“ForesightSafety Bench”AI安全评估框架，该框架系统性地覆盖了AI安全的关键领域。同时，文章揭示了AI在科学研究中的局限性，如处理生物数据库和复杂实验流程的困难。此外，研究还探讨了核能大语言模型在模拟核危机时可能表现出的侵略性战略行为，强调了AI决策过程的多样性与复杂性，为AI的未来发展与应用…

AI 治理 LLM安全科学AI AI 安全大语言模型

AI的“红后”进化与O型环自动化：监管、经济与信息战的新维度

原文

媒体Import AI2026/01/12 21:315760

本期Import AI聚焦AI研究前沿，揭示了AI在对抗性环境中可能出现的“红后AI”现象，即AI模型为击败对手而进行持续进化，而非遵循静态目标。文章探讨了“O型环自动化”在提升AI合规性与监管中的作用，并分析了AI对就业结构和经济价值创造的深远影响。同时，也警示了AI在传播阴谋论方面的潜力，呼吁制定相应政策。整体内容涵盖AI的进化机制、监管、经济影响及信…

AI研究 AI监管进化AI LLM安全工作未来