阿里千问APP推出Wan2.7模型,实现视频生成、图像创作、动作模仿等多模态能力,支持3K tokens文本输入和精准色彩控制,通过实际案例展示其在内容创作上的强大表现,强调技术普惠与商业化落地。
专题:image-generation
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 6 篇文章。
媒体量子位2026/04/03 20:548710
• Wan2.7实现多模态内容生成
• 支持3K tokens文本与精准调色
媒体AINews2026/02/26 13:447820
• Nano Banana 2支持4K图像升级
• 文本到图像任务表现最佳
谷歌与DeepMind推出Nano Banana 2,即Gemini 3.1 Flash Image Preview,是一款功能强大的图像生成与编辑模型。其核心亮点包括4K图像升级、多主题一致性及实时搜索条件生成,尤其在文本到图像任务中表现优异。同时,文章还提及其他AI模型在代理式编码和任务协作方面的进展,以及Claude的持久化记忆功能。
社区Reddit r/LocalLLaMA2026/02/23 22:215240
V6rge AI Suite 的测试版已在 Microsoft Store 上线,为用户提供图像生成和聊天两大 AI 功能。该应用旨在整合多种 AI 能力,目前已开放的核心功能允许用户进行创意图像创作和智能对话交互。开发团队承诺未来将通过更新逐步引入更多高级功能,预示着一个功能更全面的 AI 工具套件的到来。对于寻求便捷 AI 应用的用户而言,这是一个值得…
媒体机器之心2026/02/14 16:5150
字节跳动在2026年春节前同步发布豆包大模型2.0、视频生成模型Seedance 2.0和图像创作模型Seedream 5.0 Lite,构建了多模态理解、Agent、代码、视频与图像全链路能力。豆包2.0在数学、视觉推理及Agent任务上达业界最优,Seedance 2.0支持混合模态输入生成专业级短视频,Seedream 5.0 Lite加入实时检索提…
媒体Sean Goedecke2026/01/02 08:007510
文章揭露xAI的Grok模型在推特上被滥用生成低俗和性骚扰内容,涉及用户指令、模型安全机制及潜在法律风险。强调AI模型自由度与安全性之间的矛盾,并呼吁加强监管。
媒体Andrej Karpathy (YouTube)2022/08/20 02:326530
本文介绍如何利用Stable Diffusion生成迷幻风格人脸并融入梦境场景,探索生成式AI在艺术创作中的新边界。通过参数调整和训练数据优化,实现更具沉浸感的视觉体验,展示了AI在创意生成方面的潜力。