英伟达联手MIT清北发布SANA 1.5,文本生成图像技术再突破
2025-02-08 11:4431270
SANA 1.5是一种高效的线性扩散Transformer,用于文本生成图像任务。它从1.6B参数扩展到4.8B参数,采用8位优化器CAME-8bit,内存使用减少8倍,训练时间缩短60%。其GenEval得分为0.72,接近行业领先水平,推理延迟比FLUX-dev低5.5倍。
2
SANA 1.5是一种高效的线性扩散Transformer,用于文本生成图像任务。它从1.6B参数扩展到4.8B参数,采用8位优化器CAME-8bit,内存使用减少8倍,训练时间缩短60%。其GenEval得分为0.72,接近行业领先水平,推理延迟比FLUX-dev低5.5倍。