找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 41|回复: 0

基于混沌的TD3强化学习

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 20:05:10 | 显示全部楼层 |阅读模式
摘要: 混沌强化学习(CBRL)是一种方法,其中代理的内部混沌动态驱动探索。然而,在先前的研究中,CBRL中的学习算法并没有得到彻底的发展,也没有结合最近的强化学习进展。本研究引入了一种名为双延迟深度确定性策略梯度(TD3)的最新深度强化学习算法,可以处理确定性和连续动作空间,应用于CBRL。验证结果提供了几个见解。首先,TD3在简单的目标达成任务中作为CBRL的学习算法起作用。其次,具有TD3的CBRL代理可以在学习过程中自主抑制其探索行为,并在环境变化时恢复探索。最后,通过检验代理的混沌性对学习的影响,发现代理模型中存在一定范围的混沌强度,可灵活切换探索和开发,并适应环境变化。
更新时间: 2025-10-30 08:49:01
领域: cs.LG,cs.AI,cs.NE

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 18:24 , Processed in 0.089802 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表