DQN 神经网络强化学习走迷宫

2021-05-17 16:01:49 阅读：468 来源： 互联网

DQN走迷宫

1.实现最短路径走到终点
2.思路
- 2.1.强化学习（RL Reinforcement Learing）
- 2.2.深度学习（卷积神经网络CNN）
3.踩过的坑
4.代码实现（python3.6 tensorflow）
5.运行结果与分析

1.实现最短路径走到终点

在这里插入图片描述
游戏场景：黑点以每步两格的速度前进，可以任意方向行走，当撞墙后死亡并重新开始
目的：黑点通过训练，能够自动识别障碍物，并以最短路径走向终点。

2.思路

黑点行走难点是如何准确判断下一步的动作（上下左右）？而这正是强化学习想要解决的问题。应用场景中，它的状态是图片中的像素，如果图片大小是 84 * 84，batch = 4，每个像素大小在[0,255]范围内，有 256 种可能（256 个状态）ÿ

标签：终点,黑点,路径,迷宫,神经网络,DQN,256,84
来源： https://blog.csdn.net/qq_26696715/article/details/116705652

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

DQN 神经网络 强化学习 走迷宫

DQN走迷宫

1.实现最短路径走到终点

2.思路

DQN 神经网络强化学习走迷宫