专题:text-to-image

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

媒体Hugging Face Blog2026/03/04 00:506840

本文是PRX系列第三部分,深入探讨了在24小时内从零开始训练一个文本到图像生成模型的实战路径。文章详细介绍了如何通过优化策略,如利用预训练组件、高效数据处理、混合精度训练以及Hugging Face Accelerate等工具,大幅缩短模型训练周期。它不仅提供了关键的技术指导和代码示例,还强调了在追求速度的同时,如何平衡模型性能与资源消耗。对于希望快速掌握…

社区Reddit r/LocalLLaMA2026/02/10 17:2560

通义千问团队发布了 Qwen-Image-2.0,这是一个 7B 参数的统一图像生成与编辑模型。新模型支持原生 2K 分辨率,拥有逼真的纹理,并能从提示词中渲染高达 1000 个 token 的文本,适用于信息图、海报等多种场景。其多面板漫画生成能力和一致的角色保持也备受关注。虽然目前仅提供 API 和演示,但其 7B 的规模预示着未来权重开放后,将极大地…