MIT 开了一门只有九小时的课,教你用深度学习构建自动驾驶

MIT 紧跟时代步伐,开设的 6.S094 课程名为《为自动驾驶构建深度学习》的课程,旨在教学生们为自动驾驶搭建一个深度学习系统,授课者为 Lex Fridman。课程要求学生拥有基本的编程知识(最好是 Python)。

全课只有九节一小时的课程,于 1 月 9 日开课,今天就结课啦。而且!据雷锋网从议程表上了解到,从开课一直到 1 月 16 日,官网表示会陆续放出 PPT 及视频文件,雷锋网(公众号:雷锋网)会持续关注。

DeepTesla 与 DeepTraffic 就是 MIT 这门课程里面的两个重点培训内容,

  • 前者直接以端到端模型训练一个自动驾驶的起动模型;
  • 后者以游戏化的方式模拟汽车在高速公路上行驶,而我们的目标就是(没有蛀牙)训练一个神经网络,利用强化学习控制红车,并让它的速度尽可能提升到最快(也就是超车啦!速度与激情)。

那么首先我们得先补补课,为什么要采用循环神经网络呢?主要鉴于它能够将输出重新做为输入再次进入神经网络中进行训练,也就是拥有所谓的「记忆」。

强化学习的一个典型例子就是 DeepMind 训练机器玩 Atari,虽然机器并不知道游戏规则,但每一次游戏都能让机器得到一次分数的反馈,而目标就是让得分最大化。

美国人每年要浪费 80 亿小时在堵车上,因此如果能采用自动驾驶系统,让老司机们解放双手,想必真真是极好的。

DeepTesla:特斯拉自动驾驶,我也行

DeepTesla 通过一个简单的演示呈现卷积神经网络的端到端转向。顶端呈现的四个指标呈现的是前向传递及后向传递所需的时间,以及目前网络已经训练的示例,还有网络的当前状态(是处于训练数据?还是在提取数据?)。

下方的图表呈现的是损失函数,我们都知道,正常状态下随着时间的推移,损失函数的值应该会越来越小。

而在编辑器下方还有一个可视化图层的功能,用户可以在网络中看到每个图层的处理情况。如果加载了特斯拉视频,随着视频内容的增加,神经网络的训练效果也会变得更好。

下方两个小的方向盘及旁边的数值指的是实际值(蓝色)与系统预测值(白色)的对比。是不是非常智能?

以第一次加载 DeepTesla 为例:我们整个网络大小为(200,66,3)的输入层,表示宽度为200,高度66,涵盖三个通道(红绿蓝)。紧接着有一个卷积层、一个合并层与一个输出神经元。

ConvNetJS为我们提供了几种训练算法,具体能够在这里找到

DeepTraffic:让小车跑得更快

整个 DeepTraffic 游戏实际上是在网格上运行,但你也可以通过选择不同的模式,让网格呈现出来。

每辆车周围的方格表示的是它自身的速度,而橙色区域指的是该车辆可能的行驶方位。

比如在安全系统中,车辆周围会出现一个
H
型的区域,橙色表示相对安全,而红色表示周围已经有车在附近车道,此时红色小车不能越到红色区域。如果你提升了小车的速度,那么这个区域也会随之变化,毕竟如果有车挡在你的面前,为了保证安全,你一定会减缓速度(这与我们这个小游戏的目标相反)。

编程页面主要分为三块,一是实时的道路模拟情况,还能调整自己车辆的行驶速度,以提升测试速度;二是编程页面,在这里可以修改神经网络的具体代码;第三部分会显示目前神经网络的状态,还能将代码保存、重置或下载。

代码区的这几个变量可以控制网络的输入大小,更多的输入也就意味着更复杂的交通环境,也意味着需要更长的学习时间及更大的学习难度。

整个代理由一个名为「learn」的函数所控制,该函数能够接受当前的状态(以一个扁平阵列呈现),而所得到的反馈为行车速度,也就是以 mph 为单位的平均速度。

函数最基本的形式(告诉代理,让车辆维持现状,不需要变道或减速)大概长这样:

而既然这是一个追求速度的「比赛」,那么你需要通过神经网络控制车辆,比如:

在初始代码中,已经提供了上述内容。当然,你可以自行对数据进行预处理,并将这些状态输入网络,但不需要在这上面花太多时间。

这个地方就是你施展「才华」的地方——这是一个隐藏层里的一个神经元示例。

下图呈现的是最终的回归层,它决定了最终的执行环节将会呈现怎样的结果。

在 Q-Learning 里还提供了一些其它选择,可以在 Github 上找到

最后一步就是创建“大脑”。

如果点击了 run training,那么可以训练神经网络,并以 30 倍于实时的速度实现单线程运行,随后训练网络的结果会以可视化的形式呈现在电脑上,学生们也可以做一些即时反馈和改进。

该网站上的评估键可以直接运行同样的任务,也就相当于小测验。通过每次 30 分钟的 10 次运行,最后将计算出每次车辆的平均速度,并取中值做为结果。而且,本地测试的评估会受到其它车辆出现的情况的影响,所以本地的测试只能做为参考。

值得一提的是,Fridman 老师表示这些车都有着安全系统,所以不需要担心车的反应速度不够快,它们不会因为你突然操控加速减速而出车祸的。(老师入戏好深……)

Fridman 还在主页上公布了一个神经网络训练排名榜,目前有三位同学取得了很不错的成绩,甚至还有比老师训练得好的,太厉害了。

老师说了,如果速度不能提上 60km/h,那你明天就不要来上课了(误)。不过排行榜今天就截止统计啦,所以大家如果测试了比排行榜更高的分数,欢迎告诉雷锋网小编呀,我们会找你做硬创公开课的。

以上只是对 MIT 课程的简单介绍,雷锋网会做后续关注。

本文作者:奕欣

本文转自雷锋网禁止二次转载,原文链接

时间: 2017-08-01

MIT 开了一门只有九小时的课,教你用深度学习构建自动驾驶的相关文章

洗车工人开着保时捷,24小时上门洗车

洗车工人开着保时捷,24小时上门洗车,最慢3小时完成洗车任务,洗车工具选用3M.龟牌.SONAX等高档货,洗车流程严格规定,如果遇到情人节+女车主,车内还会留一支荷兰进口玫瑰. 在高大壮的外表之下,你很难看出刘大玮对车有着独特而细腻的偏好.这种偏好的一种延伸就是他忍受不了车脏.在忍受了路边洗车店的不便捷性(工作日错时,周末又排队).洗车水平参差不齐一段时间之后,他逐渐养成了自己洗车的习惯,家里也逐渐堆积了不少他淘来的高档洗车工具,并且不断更新中. 令他当初没想到的是,这一习惯发展到后来竟然给他之

开服未满24小时蓝海首杀25人普通巫妖王

国服3.3.5开放不到24小时,普通难度的巫妖王就倒在玩家的脚下.2011年1月20日,蓝海公会获取了国服25人普通巫妖王的首杀. 来自蓝海公会的击杀实录: 令玩家期待已久,2011年1月20日,国服终于开放了ICC. 清晨上线,此时的达拉然早已人山人海,有的问这问那,有的奥城门口PK,有的在排随机FB.尽管落后世界近2年的脚步,但仅仅4个月,国服就从TOC跳到ICC! 此时,征战台服的蓝海公会开始回头迈出征战ICC的步伐! 阿尔萨斯首DOWN(点击放大) 10点钟不到,我们看到蓝海队员全部踏进

开保时捷上门的24小时洗车服务

摘要: 洗车工人开着保时捷,24小时上门洗车,最慢3小时完成洗车任务,洗车工具选用3M.龟牌.SONAX等高档货,洗车流程严格规定,如果遇到情人节+女车主,车内还会留一支荷兰进口玫瑰. 洗车工人开着保时捷,24小时上门洗车,最慢3小时完成洗车任务,洗车工具选用3M.龟牌.SONAX等高档货,洗车流程严格规定,如果遇到情人节+女车主,车内还会留一支荷兰进口玫瑰. 在高大壮的外表之下,你很难看出刘大玮对车有着独特而细腻的偏好.这种偏好的一种延伸就是他忍受不了车脏.在忍受了路边洗车店的不便捷性(工作日

DeepTraffic: 如何让MIT的游戏利用深度学习来减少交通阻塞

大家都对交通阻塞深恶痛绝.除了让人头疼和错过约会之外,交通拥堵让美国的司机每年多花3000亿美元. 研究人员建议大家使用自动驾驶汽车,即使数量占比并不大,但也能大大改善交通拥堵情况. Lex Fridman和他的MIT团队开发了一款模拟游戏来加速实现这个未来. DeepTraffic模拟的是典型的公路环境,玩家使用深度学习技术来控制自己的汽车.这款模拟游戏让初学者也能接触并使用复杂的技术概念,同时也推动专家们去开发全新的技术. 采用神经网络的交通游戏 假设你在洛杉矶一条拥挤的高速公路上开车.你必

袁咏仪九小时旋风来台为潮牌旗舰店开幕剪彩

法国知名时尚品牌旗舰店在台北盛大开幕.开幕现场邀请到艺人张心妍.利瓦伊维及多位名媛.主播.知名作家共同欢庆令人兴奋的时刻.而现场最吸引镁光灯焦点的,就是许久未来台湾.获得香港金像奖影后殊荣的港星袁咏仪,她特地拨出九个小时的时间专程来台,出席旗舰店的开幕剪彩仪式.袁咏仪以一袭优雅高尚的迪奥订制礼服现身,举手投足间无不散发迷人风采,虽然已是四岁儿子的母亲,但仍掩盖不住耀眼夺目的巨星魅力.[page] [page] [page] [page] [page] [page] [page] [page] [

极飞开了场5个小时的发布会,终于讲清楚它要成为一家什么样的企业

在植保无人机领域,有两个企业总是被放在一起比较,不过结论是两家都有着自己鲜明的特色.它们分别是极客范的大疆和务实派的极飞,前者因为高精尖而经常被认为与农业的气质不符,而后者则是实实在在的在做一款为农业服务的科技产品,为此,极飞的创始团队几乎常年深入田头与农户一起研究如何做一款好的植保无人机.如今,就连他们的发布会也是让人感受到处处都在为用户思考. 从早上10点正式开始到下午5点结束,除去中间休息的2个小时,极飞的这场发布会共持续了5个小时.其中,他们发布了核心的三款无人机产品.多款升级配件,以及

工行网银系统瘫痪近九小时

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 今天中午11时许,有北京客户在使用工行网银系统时发现,该行主网站处于瘫痪状态,由此造成 网上银行系统无法登陆.据 工商银行宁夏分行一位工作人员称,实际上早9点,网上银行系统就已经不正常了. 到中午12点许,工行总行一位工作人员告诉记者,他已接到多人投诉网银系统无法使用.由此造成的问题涉及全国范围. 在北京市分行鼓楼外大街储蓄所,记者看到,由于

机构开天价培训班一年5万5教3岁孩子练财商

本孩子年龄从3岁起,其父母必须身价不菲,最好是企业董事长.金融行业高管.政府领导--"最近,一家培训机构在嘉兴高调开出为"富家子弟"量身定做的"财商"培训班. 这个机构在宣传中说,相比智商IQ.情商EQ,财商FQ也非常重要,只有培养好了财商,才能避免"富不过三代". 不过,这个一年5万5的天价培训,还是引起当地一片质疑,大家纷纷猜测,莫非又是一次"噱头经济"?莫非醉翁之意不在孩子,在于孩子的富爸爸和富妈妈? 根据宣传

全面连接困何处,卷积网络见解深(深度学习入门系列之九)

系列文章: 一入侯门"深"似海,深度学习深几许(深度学习入门系列之一) 人工"碳"索意犹尽,智能"硅"来未可知(深度学习入门系列之二) 神经网络不胜语,M-P模型似可寻(深度学习入门系列之三) "机器学习"三重门,"中庸之道"趋若人(深度学习入门系列之四) Hello World感知机,懂你我心才安息 (深度学习入门系列之五) 损失函数减肥用,神经网络调权重(深度学习入门系列之六) 山重水复疑无路,最快下降