专题:multimodal-generation

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

媒体量子位2026/04/03 20:548710
Wan2.7实现多模态内容生成
支持3K tokens文本与精准调色

阿里千问APP推出Wan2.7模型,实现视频生成、图像创作、动作模仿等多模态能力,支持3K tokens文本输入和精准色彩控制,通过实际案例展示其在内容创作上的强大表现,强调技术普惠与商业化落地。

媒体Latent Space2026/02/05 16:267860

2026年2月AI领域动态涵盖融资、代理架构、多模态生成与模型评测。Cerebras融资突破230亿美元,VS Code和GitHub Copilot集成Claude与Codex代理,METR评估GPT-5.2表现,Perplexity发布DRACO基准,vLLM在GB200上实现性能飞跃,同时多模态生成和研究进展显著,推动AI技术向更实用、更智能的方向发…