社区Reddit r/LocalLLaMA2026/02/10 17:2560
通义千问团队发布了 Qwen-Image-2.0,这是一个 7B 参数的统一图像生成与编辑模型。新模型支持原生 2K 分辨率,拥有逼真的纹理,并能从提示词中渲染高达 1000 个 token 的文本,适用于信息图、海报等多种场景。其多面板漫画生成能力和一致的角色保持也备受关注。虽然目前仅提供 API 和演示,但其 7B 的规模预示着未来权重开放后,将极大地…
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 2 篇文章。
通义千问团队发布了 Qwen-Image-2.0,这是一个 7B 参数的统一图像生成与编辑模型。新模型支持原生 2K 分辨率,拥有逼真的纹理,并能从提示词中渲染高达 1000 个 token 的文本,适用于信息图、海报等多种场景。其多面板漫画生成能力和一致的角色保持也备受关注。虽然目前仅提供 API 和演示,但其 7B 的规模预示着未来权重开放后,将极大地…
本期《AI进口》聚焦AI在机器人研发、实验室协作和API安全三个方向的突破。Ctrl-World通过可控世界模型提升机器人性能,LabOS实现AI与人类的实验协作,AI审计代理有效检测恶意微调。苹果推出Pico-Banana-400k数据集用于图像编辑训练,展示了AI在图像生成领域的进展。文章提供了具体技术细节和实验结果,具有较高的参考价值。