Speak & Spell: 基于LLM的可控语音错误增强技术用于稳健的对话状态跟踪

于红博 · 发表于 2025-11-2 21:59:04

摘要: 对话状态跟踪（DST）是任务型对话系统的关键部分，用于识别对话中的重要信息。然而，在口语对话环境中，由于自动语音识别（ASR）系统的命名实体错误，其准确性显著下降。我们引入了一种简单但有效的数据增强方法，针对这些实体，以提高DST模型的鲁棒性。我们的新方法可以使用关键词突出提示来控制错误的放置位置，同时引入音标相似的错误。因此，我们的方法在噪声和低准确性的ASR环境中生成了足够的错误模式，从而提高了准确性。

更新时间: 2025-10-30 04:29:27

领域: cs.CL,cs.AI

下载: http://arxiv.org/abs/2409.06263v2

		自动登录	找回密码
密码			立即注册

Speak & Spell: 基于LLM的可控语音错误增强技术用于稳健的对话状态跟踪

浏览过的版块