基于图像质量、社区活跃度、消费级硬件推理开销的综合评估
拥有120亿参数的先进DiT架构模型,在文本遵循、肢体渲染和排版方面取得了革命性的突破,是目前开源生态中最强大的基座模型之一。
原生1024x1024分辨率,目前生态最成熟的开源模型,拥有数十万的丰富微调模型和LoRA,是商业工作流中绝对的顶梁柱。
深度优化的中文原生图文匹配DiT模型,对中国古代文化元素、特色建筑与古风服饰有独特的理解与生成能力。
开源环境赋予了创作者无限的可能: