找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 9|回复: 0

一个用于2D射击游戏的强化学习代理

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 15:01:13 | 显示全部楼层 |阅读模式
摘要: 强化学习代理在复杂的游戏环境中经常面临奖励稀疏、训练不稳定和样本效率低的问题。本文提出了一种混合训练方法,将离线模仿学习与在线强化学习相结合,用于一个2D射击游戏代理。我们实现了一个多头神经网络,其中包含用于行为克隆和Q学习的独立输出,通过共享特征提取层和注意机制统一。最初使用纯深度Q网络的实验表现出显著的不稳定性,代理经常回到较差的策略,尽管偶尔表现良好。为了解决这个问题,我们开发了一种混合方法,从基于规则的代理的演示数据开始进行行为克隆,然后过渡到强化学习。我们的混合方法在与基于规则的对手对战时始终达到70%以上的胜率,明显优于纯强化学习方法,后者表现出高方差和频繁的性能下降。多头架构实现了学习模式之间的有效知识传递,同时保持训练稳定性。结果表明,结合基于演示的初始化和强化学习优化提供了在复杂的多代理环境中开发游戏AI代理的稳健解决方案,纯探索证明不足够。
更新时间: 2025-09-18 15:07:41
领域: cs.LG,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-1 15:18 , Processed in 0.071132 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表