首页/详情

xAI Grok Imagine API:视频生成新标杆,低延迟与高性价比并存

AINews2026/01/29 13:44机翻/自动摘要/自动分类
4 阅读

内容评分

技术含量
6/10
营销水分
7/10

摘要

本文介绍了多个AI视频生成和3D生成技术,涵盖xAI Grok Imagine API、LingBot-World开源项目及fal的Hunyuan 3D 3.1 Pro/Rapid。xAI Grok Imagine以低延迟、原生音频支持和高性价比著称,LingBot-World则强调实时交互与因果一致性,而Hunyuan 3D 3.1 Pro/Rapid拓展了3D生成的MaaS应用。这些技术对开发者和研究者具有重要参考价值。

正文

谷歌DeepMind近日推出了Project Genie,包含Genie 3、Nano Banana Pro和Gemini等模型,该系统能够根据文本或图像提示实时生成交互式内容,但目前仅限美国18岁及以上Google AI Ultra订阅用户使用,且存在生成时间较长(约60秒)和物理效果不够真实等局限。与此同时,开源项目LingBot-World提供了实时交互式世界生成模型,其延迟低于1秒,帧率为16 FPS,内容连贯性高,尤其强调交互性和因果关系的一致性。在视频生成领域,xAI Grok Imagine凭借原生音频支持、15秒的生成时长和每分钟4.20美元的有竞争力定价脱颖而出。Runway Gen-4.5则专注于动画制作流程,新增了Motion Sketch和Character Swap等功能。在3D生成方面,fal公司推出了Hunyuan 3D 3.1 Pro/Rapid,进一步拓展了模型即服务(MaaS)在3D领域的应用。

标签