专题:image-generation

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

媒体量子位2026/04/03 20:548710
Wan2.7实现多模态内容生成
支持3K tokens文本与精准调色

阿里千问APP推出Wan2.7模型,实现视频生成、图像创作、动作模仿等多模态能力,支持3K tokens文本输入和精准色彩控制,通过实际案例展示其在内容创作上的强大表现,强调技术普惠与商业化落地。

媒体AINews2026/02/26 13:447820
Nano Banana 2支持4K图像升级
文本到图像任务表现最佳

谷歌与DeepMind推出Nano Banana 2,即Gemini 3.1 Flash Image Preview,是一款功能强大的图像生成与编辑模型。其核心亮点包括4K图像升级、多主题一致性及实时搜索条件生成,尤其在文本到图像任务中表现优异。同时,文章还提及其他AI模型在代理式编码和任务协作方面的进展,以及Claude的持久化记忆功能。

社区Reddit r/LocalLLaMA2026/02/23 22:215240

V6rge AI Suite 的测试版已在 Microsoft Store 上线,为用户提供图像生成和聊天两大 AI 功能。该应用旨在整合多种 AI 能力,目前已开放的核心功能允许用户进行创意图像创作和智能对话交互。开发团队承诺未来将通过更新逐步引入更多高级功能,预示着一个功能更全面的 AI 工具套件的到来。对于寻求便捷 AI 应用的用户而言,这是一个值得…

媒体机器之心2026/02/14 16:5150

字节跳动在2026年春节前同步发布豆包大模型2.0、视频生成模型Seedance 2.0和图像创作模型Seedream 5.0 Lite,构建了多模态理解、Agent、代码、视频与图像全链路能力。豆包2.0在数学、视觉推理及Agent任务上达业界最优,Seedance 2.0支持混合模态输入生成专业级短视频,Seedream 5.0 Lite加入实时检索提…