首页/详情

OpenAI 发布 GPT-5.4,性能提升但成本高昂

AINews2026/03/06 13:44机翻/自动摘要/自动分类
4 阅读

内容评分

技术含量
8/10
营销水分
7/10

摘要

OpenAI 发布 GPT-5.4,性能提升但成本高昂。该模型在物理推理和代理编码任务中表现优异,但幻觉率高且价格昂贵。Pro 版本 CritPt 得分提升至 30%,但输出成本达 180 美元/百万标记。同时,MCP 框架和开源项目 T3 Code 也获得提及,为 AI 评估和编码协作提供新工具。

正文

OpenAI 最新发布了 GPT-5.4 模型,其在人工分析智能指数测试中与 Gemini 3.1 Pro Preview 并列第一,得分为 57,较 GPT-5.2 提升了 6 分。该模型拥有约 105 万个标记的上下文窗口,但每个标记的定价为 2.50 美元,比 GPT-5.2 的 1.75 美元高出约 42%。GPT-5.4 在物理推理(CritPt)和代理编码(TerminalBench Hard)任务中表现突出,但幻觉生成率较高,且运行成本增加约 28%。其 Pro 版本在 CritPt 上得分提升至 30%,但输出成本高达每百万标记 180 美元。社区基准测试显示,GPT-5.4 在代理和编码任务中表现优异,但在推理效率和文本真实性方面与 Claude 存在争议。OpenAI 同时更新了代理提示指南,强调工具使用、结构化输出和验证流程。此外,Claude Code 引入了本地调度任务和循环模式,MCP 框架则被视作连接 AI 评估与设计-代码循环的关键工具,其中 Truesight MCP 支持类似单元测试的 AI 评估,Figma MCP 服务器支持双向设计-代码集成。开源项目 T3 Code 也已发布,基于 Codex CLI 构建,用于代理编排编码任务。

标签