找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 46|回复: 0

Speak & Spell: 基于LLM的可控语音错误增强技术用于稳健的对话状态跟踪

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 21:59:04 | 显示全部楼层 |阅读模式
摘要: 对话状态跟踪(DST)是任务型对话系统的关键部分,用于识别对话中的重要信息。然而,在口语对话环境中,由于自动语音识别(ASR)系统的命名实体错误,其准确性显著下降。我们引入了一种简单但有效的数据增强方法,针对这些实体,以提高DST模型的鲁棒性。我们的新方法可以使用关键词突出提示来控制错误的放置位置,同时引入音标相似的错误。因此,我们的方法在噪声和低准确性的ASR环境中生成了足够的错误模式,从而提高了准确性。
更新时间: 2025-10-30 04:29:27
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 15:40 , Processed in 0.085322 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表