OpenAI 与 Paradigm 联手发布 EVMbench:AI 代理智能合约漏洞评估基准原文官方OpenAI Blog2026/02/18 08:005730OpenAI 与 Paradigm 联合发布 EVMbench,提供针对 AI 代理的智能合约漏洞检测、修复和利用能力的统一基准。工具收录 30+ 高危漏洞,支持多维度评分并开放 Docker 与 Python SDK,首批评测覆盖主流大模型,帮助安全团队快速评估 AI 在合约安全中的实际表现。以太坊虚拟机智能合约安全AI代理基准测试大语言模型