找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 11|回复: 0

基于矩谱和功率谱的高斯性正则化方法用于文本到图像模型

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 14:58:13 | 显示全部楼层 |阅读模式
摘要: 我们提出了一种新颖的正则化损失,强制执行标准高斯性,鼓励样本与标准高斯分布对齐。这有利于在文本到图像模型的潜在空间中进行优化的一系列下游任务。我们将高维样本的元素视为一维标准高斯变量,并定义一个综合损失,将空间域中基于矩的正则化与谱域中基于功率谱的正则化结合起来。由于矩和功率谱分布的期望值是可以分析得知的,该损失促使符合这些属性。为了确保置换不变性,损失应用于随机置换的输入。值得注意的是,现有基于高斯性的正则化均落入我们的统一框架中:一些对应于特定阶数的矩损失,而先前的协方差匹配损失等同于我们的谱损失,但由于其空间域计算而引起更高的时间复杂度。我们展示了我们的正则化在生成建模中的应用,用于测试时间奖励与文本到图像模型对齐,特别是用于增强美学和文本对齐。我们的正则化优于先前的高斯性正则化,有效地防止奖励破解并加速收敛。
更新时间: 2025-09-18 15:35:34
领域: cs.CV,cs.AI,cs.LG

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-2 07:16 , Processed in 0.073743 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表