本篇文章3688字,读完约9分钟
雷锋。搜索“雷锋”。本文是图森互联网首席技术官侯晓迪对硅谷新浪科技记者毛舒的预约访问的书面回复。毛舒在文章中引用了侯孝迪的主要观点。雷锋。网站已被原作者授权发表。如果您需要重印,请联系授权。
这并不意味着他可以不用开车就能开车,就像邓亚萍可以打好乒乓球一样,也不意味着她可以成为一个搜索引擎。按照发言时间的顺序,浏览2016年9月13日乔治·霍兹的技术危机会议的主要内容。
我不知道mobileye令人震惊的阴暗场景是否是为了吸引人们的注意力。乔治·霍兹一开始列出了几家“有趣的”无人驾驶公司,而mobileye是首当其冲的。他这样说:
他们的商业模式是与监管机构合作,降低没有mobileye芯片的汽车的安全等级。
mobile eye的商业模式是通过与立法者勾结来降低没有mobile eye芯片的汽车的安全等级。
如果有人能通过这样一个美妙的商业模式,让一家公司在17年内不倒闭,却拥有90亿美元的市场价值,这将是一个奇迹。
事实上,自2001年第一代mobile eye芯片问世以来,mobile eye提供的辅助驾驶和半自动驾驶系统一直是世界上性能最佳的产品。
特斯拉无人驾驶汽车也是mobileye家族的eq3解决方案,这里有一则轶事。早在2015年底,特斯拉就为彭博的虚假报道写了一篇面对面的文章。文章的最后一句是这样的:“mobileye的视觉芯片是世界上最好的,正因为如此,我们选择了它。”
然后乔治·霍兹继续说着令人惊奇的话:
因为特斯拉太创新了,它吓到了他们(mobileye)。事故发生后,mobileye害怕了。他们不想参与创新。
特斯拉是如此的创新,以至于让mobileye感到害怕。所以事故发生后,他们只是举手投降,停止创新。
这更没脑子。特斯拉和mobileye合作是因为合同到期,双方都不会续签合同。
mobile eye创始人兼首席执行官曾表示,特斯拉有意或无意地让人们使用辅助驾驶作为自动驾驶,这不是mobile eye的初衷。而且,在现阶段,该技术确实无法实现自动驾驶,因此不会续签合同。
但在更深的层面上,这两个家庭将不可避免地破裂。像特斯拉这样的公司不可能通过与世界上其他公司和拥有独特技术的公司长期合作来建立自己的核心电力。
999美元自动驾驶在侵入了多家汽车公司之后,乔治·霍兹从他的黑色口袋里拿出了他的驾驶模块:
逗号一——这就是你开车所需要的一切
有趣-自动驾驶,就这样。
然后轻轻地补充道
驾驶自动驾驶能力有限的本田汽车所需的一切
它可以自动驾驶带有车道保持系统的本田汽车。
当我听到这些,我差点把我的旧血吐在键盘上。作为自动驾驶人工智能公司的首席技术官,我一直关注着本田的车道保持辅助系统。
简而言之,当车速超过45英里并且道路环境清晰时,该系统可以自动驾驶。
-是的,当车道线弯曲时,方向盘会自动转动。
-是的,当前方速度减慢时,它会自动减速。这是本田和许多其他汽车制造商带来的另一个被称为自适应巡航控制的功能。
等一下。这不是已经被描述为自动驾驶吗?
但是为什么本田从来没有声称能够在技术危机中断会议上自动驾驶?因为,毕竟,作为一个负责任的汽车制造商,你不能把乘客的生命押在公关上。
当本田推出这款产品时,它要求司机把手放在方向盘上,并诚实地列出他不能做的所有场景:
当车道线不可见时,laks功能不可用;
当速度小于45英里时,laks功能不可用;
当车道过度弯曲时,laks功能不可用;
当打开转向灯时,laks功能不可用;
制动后,laks功能不可用;
在如此多的限制下,稍微瘦一点的人自然不会说他们会自动驾驶。
事实上,目前除了使用激光雷达的谷歌和百度之外,没有人声称基于机器视觉可以实现自动驾驶。
毕竟,没有被测量的产品(也不敢自己测量),我不知道他能突破这五个极限中的哪一个。但他在会上提到了一个细节:
汽车的内置前置雷达…和一个前置摄像头,这和特斯拉的自动驾驶仪是一样的。
(逗号一的输入包括)预装在车内的前向雷达和单个前向摄像机;与特斯拉的配置相同。
也就是说,你无法观察到汽车两侧和尾部的任何信息!换句话说,如果你嘲笑所谓的“自动驾驶”,你可能根本就不能换车道。
更可怕的是,搞笑的应该安装在后视镜的位置,也就是说,上车后后悔手动切断已经太晚了。
当然,乔治·霍兹自己后来也承认,所谓的自动驾驶戏弄人的行为仍然需要观察:
你必须集中注意力,你必须随时准备好接管它。
(开玩笑时)你仍然必须时刻保持头脑清醒,准备好切换到手动驾驶。
那么,当你开始变得黑色和移动时,你是什么意思?!
接下来,大数据和机器学习将进入技术环节。主持人首先谈到车队学习(通过历史数据提高同一路线自动驾驶的可靠性)。乔治·霍兹自豪地将自己与mobileye(特斯拉)区分开来:
当我们运送这个的时候,我们的舰队学习会比特斯拉的更好,因为我们有所有的视频数据。特斯拉只有mobileye特征向量和雷达。
发货后,我们的道路学习能力将高于特斯拉,因为我们拥有所有原始视频数据,相比之下,特斯拉只有手机眼特征向量和雷达数据。
听到这里,我不知道该做什么表情。这些数据比其他数据更原始,没什么好炫耀的。相反,它会带来从传输到存储的各种工程问题。最重要的不是数据有多原始,而是算法如何处理数据。
接下来,乔治·霍兹这样解释他的算法:
这是深度学习。它使用摄像机试图预测人类在这种情况下会做什么。如果它预测了一些合理的东西——它有一个对合理性的内部测试——它会走这条路。
我们的车只有2000行代码,但是它也有一个5mb的模型,是用机器学习学来的,你可以有效地把这个模型想象成代码。这个东西是通过深度学习产生的,它编码了所有的边缘案例。我们能这么快完成的原因是因为我们有数据。我们用这么少的代码就能做到这一点的原因是因为我们有如此先进的机器学习
这是深刻的学习。根据摄像机输入,预测人类驾驶员将对当前场景做出什么动作。如果算法预测的动作是可靠的(里面有一个额外的检查机制——这将在后面提到),控制汽车执行。
我的模型有2000行代码,包括一个5mb的模型文件。你可以把这个模型理解为代码。它是通过深入学习来学习的,可以包括各种极端情况。我们只用了几个月时间来构建这个系统的原因是因为我们有大量的数据,我们只写了2000行代码的原因是因为机器学习非常先进。
说实话,我一生中见过的所有自信地跳过全球公认的技术难题并声称解决所有问题的人都是平民。
乔治·霍兹可能认为他在读完《咖啡》21天后就明白了深度学习的真正含义。然而,这是幻觉,这不是科学。
然后主持人询问了系统的安全性,乔治·霍兹自信地回答说:
首先,我们的车有非常严格的torc限制,关于它能转动方向盘的程度,以及刹车的力度…
这就是我们如何保证安全
我们对算法输出的扭矩有非常严格的限制,这样就不会猛踩方向盘或刹车。只有这样我们才能确保安全。
原来,这就是他刚才提到的“附加检查机制内部合理性测试”。你知道,特斯拉的自动驾驶到目前为止已经撞了好几次,但没有一次是由于你刹车或转弯不够轻造成的!
据说他们的训练数据只有30万英里和7900小时。得了吧,这些数据都在自动驾驶圈里,提起它会让人觉得尴尬。你知道,特斯拉在第一次碰撞前安全行驶了1.3亿英里。
乔治·霍兹的驱动解决方案,无论如何改变,加上大数据、深度学习等热门词汇,已经在学术上确定下来。近年来,人们习惯称这种做法为端对端学习,在此之前还有其他别名,如模仿学习。
这种方法的一个主要限制是它只能处理以前见过的输入类型。如果在实际测量过程中,遇到的情况和训练数据之间的差异太大,超过了模型不变性所能容忍的上限,这样的系统将跪几分钟。
就连卷积网络的发明者、facebook人工智能研究的领导者扬·勒昆·杨丽坤教授也对这种将端到端学习用于自动驾驶的想法发表了评论:
训练一个基本的convnet让你大部分时间都在车道上是相当简单和直接的。问题是使它可靠地工作。
20世纪80年代末,cmu的dean pomerleau开发了一种训练神经网络的基本技术,这个系统叫做alvinn。早在2003年,我就用模仿学习来训练一个名为dave的自动驾驶机器人的convnet。这项工作推动了darpa lagr项目。
这个人所做的可能很酷,但并不是特别创新。
训练一个基本的卷积网络来保持车道线并不困难,但困难在于可靠性。
早在20世纪80年代,卡内基梅隆大学的院长波默罗就提出了基于神经网络的车道保持基本模型,称之为alvinn。2003年,我用这种模仿学习的方式,建造了一个自动驾驶机器人戴夫,它有滚轮和网络。后来,美国国防部高级研究计划局的lagr项目在这里开始。
这家伙的工作既酷又有创意。
想象一个主要在加利福尼亚收集数据的系统。下了多少次雨和雪?你有没有看到开夜车时迎面而来的远光灯?你见过站在路中间的兔子、野猪和麋鹿吗?你见过行人或自行车穿越马路吗?更不用说自动驾驶只有5mb的模型文件,看看北京著名的地标西直门立交桥。