导读 研究团队(包括纽约大学、麻省理工学院和谷歌的研究者)提出了一个创新框架,旨在解决扩散模型推理时间扩展的瓶颈。该框架通过验证器反馈和...
研究团队(包括纽约大学、麻省理工学院和谷歌的研究者)提出了一个创新框架,旨在解决扩散模型推理时间扩展的瓶颈。该框架通过验证器反馈和算法优化噪声候选两个维度展开,以SiT-XL模型为基础,引入额外计算资源。实验采用Inception Score和Fréchet Inception Distance两个验证器,结果显示,在多个基准测试中,该框架表现出色,特别是在DrawBench测试中,样本质量持续提升。
该研究不仅验证了基于搜索的计算扩展方法的有效性,还揭示了不同验证器的固有偏差,为未来视觉生成任务验证系统的开发提供了方向,对提升AI生成模型性能具有重要意义。