OpenAI发布GPT-5.4 mini与nano:超低成本图像描述,52美元搞定7.6万张照片
内容评分
摘要
OpenAI推出GPT-5.4 mini与nano两款低成本轻量模型,nano仅需0.2美元/百万token,可高效生成图像描述。实测以52美元完成7.6万张博物馆照片的自动化描述,成本极低。模型支持已集成至llm 0.29工具,同时展示了在复杂生成任务(如鹈鹕骑车SVG)中的多级推理能力,适合大规模视觉内容理解场景。
正文
OpenAI今日发布GPT-5.4 mini与GPT-5.4 nano两款轻量级语言模型,与两周前推出的GPT-5.4共同构成新一代推理模型矩阵。根据官方测试,GPT-5.4 nano在高推理负载下性能超越GPT-5.4 mini,而后者推理速度提升两倍。
定价方面(每百万输入):GPT-5.4为2.50美元,GPT-5.4 mini为0.75美元,GPT-5.4 nano低至0.20美元。以John M. Mossman锁具收藏馆的76,000张照片为例,使用GPT-5.4 nano生成每张图像描述平均消耗2,863个(2,751输入 + 112输出),单张成本仅0.069美元,总成本约52.44美元。
示例输出: <code> -m gpt-5.4-nano -a IMG_2324.jpeg 'describe image'</code> “图片展示了一个博物馆画廊的内部景象,画廊内有一面长长的展示墙。白色砖墙上有许多装裱好的肖像画,排列整齐。肖像画下方是多个玻璃展柜,展柜采用深色木质框架和玻璃材质,内陈列着各种历史文物和设备。房间地面铺设着抛光木地板,天花板装有吊灯,墙壁上方可见几根管道。前景中,玻璃展柜沿着房间长度排列,反射出其他区域的物品。”
作者同步发布了 0.29版本,新增对新模型的支持。此外,作者还使用OpenAI Codex测试了五种推理强度与三种模型,生成了‘鹈鹕骑自行车’的SVG图像(见<a href="https://gist.github.com/simonw/f16292d9a5b90b28054cff3ba497a3ca">此处</a>),其中GPT-5.4在‘xhigh’设置下表现最佳,细节丰富,鹈鹕喙中甚至叼着一条鱼。