找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 16|回复: 0

Empathy-R1:一种用于长篇心理健康支持的连锁同理心和强化学习框架

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 15:17:06 | 显示全部楼层 |阅读模式
摘要: 同理心对于有效的心理健康支持至关重要,特别是在处理长篇辅导文本(LCTs)时。然而,现有的大型语言模型(LLMs)往往生成在语义上流畅但缺乏真正心理支持所需的结构化推理,特别是在中国背景下。为了弥合这一差距,我们引入了Empathy-R1,这是一个新颖的框架,将同理心链(CoE)推理过程与强化学习(RL)相结合,以提高对LCTs的响应质量。受认知行为疗法的启发,我们的CoE范式引导模型依次推理求助者的情绪、原因和意图,使其思维过程既透明又可解释。我们的框架得益于一个新的大规模中文数据集Empathy-QA和一个两阶段训练过程。首先,监督微调灌输CoE的推理结构。随后,受专门奖励模型引导的RL,优化了最终响应的治疗相关性和语境适当性。实验表明,Empathy-R1在关键自动评估指标上取得了良好的表现。更重要的是,人类评估证实了其优越性,显示出对强基线的明显偏好,并在我们的新基准测试上实现了44.30%的Win@1率。通过实现可解释和语境细致的响应,Empathy-R1代表了在开发负责任和真正有益的心理健康支持人工智能方面的重大进步。
更新时间: 2025-09-18 11:16:09
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-1 15:16 , Processed in 0.078969 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表