找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1|回复: 0

蛇2与寂静相遇:稀疏区域的强大声音源分离

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 23:13:02 | 显示全部楼层 |阅读模式
摘要: 我们介绍了一种新的音乐源分离模型,专为准确地隔离人声而设计。与通常无法捕捉间断出现的人声的基于Transformer的方法不同,我们的模型利用了最近的状态空间模型Mamba2,以更好地捕捉长期时间依赖关系。为了高效处理长输入序列,我们将带分割策略与双路径架构相结合。实验证明我们的方法优于最近的最新模型,实现了11.03 dB的cSDR-目前报道的最佳结果,并在uSDR上取得了实质性的收益。此外,该模型在不同输入长度和人声出现模式下表现稳定一致。这些结果表明,基于Mamba的模型在高分辨率音频处理方面是有效的,并为音频研究中更广泛的应用开辟了新的方向。
更新时间: 2025-12-31 07:56:14
领域: cs.SD,cs.AI,eess.AS

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-13 07:01 , Processed in 0.073347 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表