|
摘要: 同理心对于有效的心理健康支持至关重要,特别是在处理长篇辅导文本(LCTs)时。然而,现有的大型语言模型(LLMs)往往生成在语义上流畅但缺乏真正心理支持所需的结构化推理,特别是在中国背景下。为了弥合这一差距,我们引入了Empathy-R1,这是一个新颖的框架,将同理心链(CoE)推理过程与强化学习(RL)相结合,以提高对LCTs的响应质量。受认知行为疗法的启发,我们的CoE范式引导模型依次推理求助者的情绪、原因和意图,使其思维过程既透明又可解释。我们的框架得益于一个新的大规模中文数据集Empathy-QA和一个两阶段训练过程。首先,监督微调灌输CoE的推理结构。随后,受专门奖励模型引导的RL,优化了最终响应的治疗相关性和语境适当性。实验表明,Empathy-R1在关键自动评估指标上取得了良好的表现。更重要的是,人类评估证实了其优越性,显示出对强基线的明显偏好,并在我们的新基准测试上实现了44.30%的Win@1率。通过实现可解释和语境细致的响应,Empathy-R1代表了在开发负责任和真正有益的心理健康支持人工智能方面的重大进步。 更新时间: 2025-09-18 11:16:09 领域: cs.CL,cs.AI
|