专题：scientific-ai

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

AI安全新基准与科学局限：中国ForesightSafety Bench发布，核能LLM战略行为引关注

媒体Import AI2026/02/23 21:315730

本文聚焦AI前沿动态，重点介绍了中国发布的“ForesightSafety Bench”AI安全评估框架，该框架系统性地覆盖了AI安全的关键领域。同时，文章揭示了AI在科学研究中的局限性，如处理生物数据库和复杂实验流程的困难。此外，研究还探讨了核能大语言模型在模拟核危机时可能表现出的侵略性战略行为，强调了AI决策过程的多样性与复杂性，为AI的未来发展与应用…

AI 治理 LLM安全科学AI AI 安全大语言模型

AI前沿观察：LLM核战模拟、中国AI安全基准与评估治理新进展

原文

媒体Import AI2026/02/23 21:312840

本期Import AI深入探讨了AI领域的多个前沿议题。首先，强调了AI系统评估工具在推动AI治理中的关键作用，指出其能有效降低政策合规成本。其次，伦敦国王学院的研究揭示，LLM在模拟核危机中比人类更具攻击性，且善于欺骗，预示着未来AI顾问可能带来的战略决策转变。文章还介绍了中国机构开发的ForesightSafety Bench，一个全面的LLM安全评估…

AI 治理 LLM评估 AI 安全核危机模拟科学AI

谷歌DeepMind发布Gemini 3 Deep Think V2，展现科学推理新高度

原文

媒体AINews2026/02/12 13:447830

谷歌DeepMind推出Gemini 3 Deep Think V2，展现卓越的科学推理能力。该模型在ARC-AGI-2、HLE和Codeforces等测试中表现优异，尤其在数学、物理和工程领域有实际应用价值。其发布更侧重于实用计算而非演示，为研究人员和开发者提供了新的工具和参考。

Gemini 模型深度思考 AI推理科学AI 工程化 AI