专题:formal-verification

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

媒体量子位2026/03/03 18:286940

AI Agent Gauss在短短一周内独立完成了2022年菲尔兹奖得主Maryna Viazovska关于8维和24维最优球体堆积问题的形式化证明。这项由Math Inc.开发的AI,仅用5天就完成了8维部分的验证,并在一周内生成了约20万行Lean代码,成为史上最大规模的单一目的Lean形式化项目。Gauss不仅大幅缩短了原需数月的工作量,还自主发现并…

官方OpenAI News2026/02/20 22:304630

团队在“First Proof”数学挑战中首次提交了基于大语言模型的自动证明实验。通过微调 GPT‑4‑Turbo 并使用链式思考提示,模型在 10 条高阶定理中生成了 3 份形式化草稿,其中 1 份在 Coq 中通过基本检查。实验展示了模型在推理速度上的优势,但在逻辑严谨性和跨领域概念掌握上仍有显著不足,后续将引入交互式定理证明器进行闭环优化。

社区Hacker News2026/02/17 20:585360

Lean 4是一款先进的交互式定理证明器,专注于自动化验证数学定理的正确性。它在人工智能领域展现出显著的竞争优势,能够高效处理复杂的数学问题,大幅减少人工验证的工作量,从而显著提升AI研究与开发的效率。其核心亮点在于通过严谨的形式化验证,确保AI算法和模型的数学基础无懈可击,进而提升系统的可靠性与可信度。Lean 4不仅促进了数学理论与AI技术的协同发展,…