找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 14|回复: 0

明确的上下文驱动神经声学建模用于高保真RIR生成

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 14:43:04 | 显示全部楼层 |阅读模式
摘要: 实际声音模拟在许多应用中起着关键作用。声音模拟中的一个关键元素是房间冲激响应(RIR),它描述了声音如何在给定空间内从源头传播到听众。最近的研究应用神经隐式方法,利用从环境中收集的上下文信息,如场景图像,来学习RIR。然而,这些方法并未有效利用环境中的显式几何信息。为了进一步利用具有直接几何特征的神经隐式模型的潜力,我们提出了Mesh-infused Neural Acoustic Field(MiNAF),它在给定位置查询一个粗糙的房间网格,并提取距离分布作为本地上下文的显式表示。我们的方法表明,纳入显式的本地几何特征可以更好地引导神经网络生成更准确的RIR预测。通过与传统和最先进的基准方法进行比较,我们展示了MiNAF在各种评估指标上的竞争表现。此外,我们验证了MiNAF在训练样本有限的数据集中的稳健性,展示了高保真度声音模拟的进步。
更新时间: 2025-09-18 17:57:07
领域: cs.SD,cs.AI,cs.LG

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 21:24 , Processed in 0.081726 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表