|
摘要: 无需模拟训练框架一直处于连续空间生成建模革命的前沿,导致大规模扩散和流匹配模型。然而,这种现代生成模型因昂贵的推断而备受困扰,阻碍了它们在众多科学应用中的使用,如分子构象的Boltzmann生成器(BGs)需要快速的似然评估。在本文中,我们重新审视了在BGs背景下提供高效采样和似然性的经典归一化流,但通过最大似然进行训练通常不稳定且计算复杂。我们提出了一种新颖且可扩展的基于回归的归一化流训练目标(RegFlow),该目标绕过了传统最大似然训练的数值不稳定性和计算挑战,而倾向于简单的$\ell_2$-回归目标。具体来说,RegFlow将我们流下的先验样本映射到使用最优传输耦合或经过预训练的连续归一化流(CNF)计算的目标。为了增强数值稳定性,RegFlow采用有效的正则化策略,例如享受无痛实施的新前向-后向自洽损失。从经验上讲,我们证明RegFlow解锁了一类之前难以训练的BGs架构,最大似然。我们还展示了RegFlow在丙氨酸二肽,三肽和四肽的笛卡尔坐标的平衡采样中超过了最大似然训练的性能,计算成本和稳定性,展示了其在分子系统中的潜力。 更新时间: 2025-10-30 07:20:59 领域: cs.LG,cs.AI,stat.ML
|