发布时间:2026-05-22 已有: 位 网友关注
币界网消息,RAEv2开源项目由Adobe Research、澳大利亚国立大学与纽约大学的谢赛宁团队等机构联合推出,收敛速度提升10倍,80轮训练超越前代800轮纪录。新版本作为取代传统变分自编码器的扩散模型图像重构方案,解决了初代重构质量差、无法使用标准无分类器引导以及收敛极慢等痛点。在ImageNet上仅需80轮训练即可达到1.06的全局FID成绩。研究团队在架构设计上实现了三项核心优化,采用多层表示方案,将编码器最后K层的输出直接相加,保留底层子空间的结构。新架构还阐明了表示自编码器与表示对齐的互补机制,使得在生成任务中表现更强。测试显示,要达到GFID小于2的指标,初代模型需要177轮,而新架构仅需35轮。