找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 18|回复: 0

Empathy-R1:一种长篇心理健康支持的同理心和强化学习框架

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 20:03:02 | 显示全部楼层 |阅读模式
摘要: 共情对于有效的心理健康支持至关重要,特别是在处理长篇辅导文本(LCTs)时。然而,现有的大型语言模型(LLMs)往往生成语义流畅但缺乏结构化推理的回复,这在中国语境下尤为明显。为了弥合这一差距,我们引入了Empathy-R1,这是一个新颖的框架,将共情链(CoE)推理过程与强化学习(RL)相结合,以提高LCTs的响应质量。受认知行为疗法启发,我们的CoE范式引导模型依次推理求助者的情绪、原因和意图,使其思考过程既透明又可解释。我们的框架得益于一个新的大规模中文数据集Empathy-QA和一个两阶段训练过程。首先,监督微调灌输CoE的推理结构。随后,受专用奖励模型指导的RL调整最终回复的治疗相关性和语境适切性。实验证明,Empathy-R1在关键自动度量标准上取得了强劲表现。更重要的是,人类评估证实其优越性,显示出明显优于强基线并在我们的新基准测试中达到了44.30%的Win@1率。通过实现可解释且语境细腻的回复,Empathy-R1代表了在开发负责任和真正有益的心理健康支持人工智能方面的重大进步。
更新时间: 2025-09-19 07:24:59
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 08:42 , Processed in 0.074004 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表