ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

深度跑车 - DeepRacer

2020-02-01 17:42:27  阅读:464  来源: 互联网

标签:比赛 训练 智能 跑车 AWS 学习 车模 深度 DeepRacer


image

在当地时间11月28日,美国拉斯维加斯举办的AWS(Amazon Web Services)产品发布会中,CEO Adny Jassy 在宣布的十多个产品中居然也包括有一个用于智能赛车比赛的产品 AWS DeepRacer,计划建立全球自动小车比赛联盟,开放给任何人参加比赛。看看这款1/18的四轮赛车车模如下配置,主要的传感器包括有一个400万像素的摄像头。车模售价$399,明年三月份上市。image

^AWS 宣布的比赛智能车模硬件配置^

None

现在这款车模中的增强学习算法可以借助于亚马逊的DeepRacer 云平台中SageMaker提供的强化学习(Reinforce Learning) 进行训练学习。看来智能车模比赛正在快速变得更深。

什么是强化学习,它具体如何实现,将来会推文介绍。那么使用强化学习训练处来的车模究竟跑的怎么样呢?

下面的动图是采集自参赛同学的哥哥在产品发布现场看到的演示:

image

经过RL训练后的车模运行情况1

image

经过RL训练后的车模运行情况2

估计所有看到这款使用AI训练的车模在这样的环境中跑车这样,不免有些失望。车模上还配置了那么强大的处理器和传感器,为何仅仅跑成这个样子?国内的智能车竞赛的车模在同样的赛道上估计早就把他甩到十万八千里了。

这个车模对于赛道的识别和控制规律都是在AWS DeepRacer 3D 仿真环境下,通过增强模型训练处来的。

image

通过在仿真赛道上进行评估,对强化学习中的Q函数以及网络参数进行细调,重新训练提高运行速度。

最终将训练后的模型下载的模型车模完成现场的运行和演示。

image

由于这个跑车在之前没有在实际物理系统中运行过,所有的识别和控制算法都是通过后天练习而得到的,所以跑成这个样子已经是奇迹了。

现在有一个问题:

训练跑成这样,这是智能吗?

小羊在出生后一个小时就会奔跑了,而人类的婴儿需要长到三个月才能够抬起头了。如果从早起运动来看,人类的婴儿几乎没有任何生存能力。

image

对于小羊来说,运动能力获得来自于其神经系统固化了的本能,而人类的运动本领则通过后天在于环境的交互过程中学习而来的,这是两者之间的区别。

这就是我们定义的智能吗?

如果非要这样定义的话,现在全国大学智能汽车竞赛中的所有算法都是帮助车模建立的先天本能,相当于会跑的小羊。而前面演示的车模,虽然跌跌撞撞,但的确是通过增强学习而得到的,相当于人类的婴儿。

不过需要说明的是,前面的车模训练是在虚拟环境下进行的。如果不是这样,这个车模在跑散架之前也不会学到任何能力。所以前面所讲到的车模自学习,也只是形式上的事情,不是真的在实际中学到的。

image

因此,可以将这种在虚拟环境下的训练看成对于对车模编程的另外一种表示:即使用一种非常笨拙的,愚蠢的网络方式将控制技能预先教给车模,即存储在车模里。虽然看起来没有为车模控制专门编写一行代码,但实质上只是偷偷的换了一种形式而已。

而相反,国内现在的车模比赛,同学们则是通过自己的大脑,将这些规则通过精确、简练的算法编程在车模里,使得它在及其有限的资源下非常高效的运行。跑得如此之快,以至于最终决定比赛胜负需要靠优化车模的机械结构和轮胎来达到了。

image

但对于前面通过增强学习的方式来训练车模,由于效率的低下,所以只能靠慢慢的调参来提高,即使不得不购买AWS提供的云端强大的运算资源,估计所能够达到的效果也只能够是前面动图中所显示的那样,比较蹩脚的奔跑。远达不到一个需要调整机械和轮胎来提高车模速度的程度。

因此,将来比赛中,你是愿意为车模极速奔跑而做一个调整机械结构和打磨轮胎的智能车赛手,还是愿意做一个使用增强学习训练车模运行的一个调参码农呢?

下面是发来上述信息的同学在公众号中的留言:

今天我哥在现场参会,他知道我对智能车感兴趣,所以特地跟我视频看他们调试。跑得确实不快而且不稳,我还以为是在training,问了现场人员才知道小车上已经在运行pre-trained model了(当然很有趣的是他们是在模拟器里预训练的)。虽然这样一看远不如我们的智能车比赛,但毕竟从控制决策的角度而言,可能一行代码也不需要写。由于使用了reinforcement learning,所以也不需要大量的人工标注。或许在足够的training以后,最后的model可以远远超出人工规则的性能。image

当然aws此举应当主要还是推广其sagemaker和robomaker等服务,但也许这正将是未来的机器人计算形态。看到249刀的价格我不禁感叹,我们当年花费了比这多的多的钱,最后为了追求速度,时间也都花在了调机械磨轮子上,好多队员也因为后面的调试枯燥无味,放弃了比赛。看到这个平台我就想,如果我们设立一个组别,让比赛场景和任务复杂起来,最终以小车完成的任务多少或闯过多少关来评判分数,这将可以让学生更多地把时间用在提高小车的“智能水平”上,而不仅是机械和电路等性能上。毕竟,自动化不仅仅是控制理论的自动化,未来更应当是感知与决策的自动化。image

卓晴 发布了212 篇原创文章 · 获赞 1 · 访问量 5440 私信 关注

标签:比赛,训练,智能,跑车,AWS,学习,车模,深度,DeepRacer
来源: https://blog.csdn.net/zhuoqingjoking97298/article/details/104135156

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有