OpenAI 发布 GPT-5.4，性能提升但成本高昂

AINews2026/03/06 13:44机翻/自动摘要/自动分类

内容评分

技术含量

8/10

营销水分

7/10

摘要

OpenAI 发布 GPT-5.4，性能提升但成本高昂。该模型在物理推理和代理编码任务中表现优异，但幻觉率高且价格昂贵。Pro 版本 CritPt 得分提升至 30%，但输出成本达 180 美元/百万标记。同时，MCP 框架和开源项目 T3 Code 也获得提及，为 AI 评估和编码协作提供新工具。

正文

OpenAI 最新发布了 GPT-5.4 模型，其在人工分析智能指数测试中与 Gemini 3.1 Pro Preview 并列第一，得分为 57，较 GPT-5.2 提升了 6 分。该模型拥有约 105 万个标记的上下文窗口，但每个标记的定价为 2.50 美元，比 GPT-5.2 的 1.75 美元高出约 42%。GPT-5.4 在物理推理（CritPt）和代理编码（TerminalBench Hard）任务中表现突出，但幻觉生成率较高，且运行成本增加约 28%。其 Pro 版本在 CritPt 上得分提升至 30%，但输出成本高达每百万标记 180 美元。社区基准测试显示，GPT-5.4 在代理和编码任务中表现优异，但在推理效率和文本真实性方面与 Claude 存在争议。OpenAI 同时更新了代理提示指南，强调工具使用、结构化输出和验证流程。此外，Claude Code 引入了本地调度任务和循环模式，MCP 框架则被视作连接 AI 评估与设计-代码循环的关键工具，其中 Truesight MCP 支持类似单元测试的 AI 评估，Figma MCP 服务器支持双向设计-代码集成。开源项目 T3 Code 也已发布，基于 Codex CLI 构建，用于代理编排编码任务。

OpenAI 发布 GPT-5.4，性能提升但成本高昂

内容评分

摘要

正文

标签