找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 8|回复: 0

MeanFlowSE:通过条件均值流的一步生成式语音增强

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 15:16:43 | 显示全部楼层 |阅读模式
摘要: 多步推理是实时生成性语音增强的瓶颈,因为基于流和扩散的系统学习瞬时速度场,因此依赖于迭代的常微分方程(ODE)求解器。我们引入了MeanFlowSE,一个条件生成模型,它学习沿轨迹的有限间隔内的平均速度。使用雅可比-向量积(JVP)来实例化MeanFlow身份,我们推导出一个本地训练目标,直接监督有限间隔位移,同时保持对角线上的瞬时场约束一致。在推断中,MeanFlowSE通过向后位移执行单步生成,消除了多步求解器的需要;一个可选的几步变体提供额外的细化。在VoiceBank-DEMAND上,单步模型以比多步基线更低得多的计算成本实现了强大的可理解性、保真度和感知质量。该方法不需要知识蒸馏或外部教师,提供了一个高效、高保真度的实时生成性语音增强框架。
更新时间: 2025-09-18 11:24:47
领域: cs.SD,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-1 15:18 , Processed in 0.069317 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表