本篇文章2940字,读完约7分钟
编者按:我们和电脑之间的交流正在发生变化,深度学习已经悄悄地进入我们的生活。甚至在你意识到这一点之前,世界已经完全不同了。
这篇文章由老卢爱奥、姜晓片、何瑶共同编辑,首次在《财富》杂志上发表,共分两部分,未经雷锋允许,不得转载。
深度学习技术已经诞生了几十年。经过一段时间的蛰伏,现在已经进入第二个春天,成为计算机行业的新加速器,它将彻底改变美国企业未来的面貌。
在过去的四年里,恐怕读者可以清楚地感受到科技的进步对我们日常生活的影响。其中,最明显的是智能手机语音识别功能的大跃进。这真的比以前好多了,至少当你命令它给你的儿媳妇打电话时,你不会不经意地给你的前女友打电话。
事实上,我们和电脑之间的交流方式正在改变,原来噼啪作响和敲打的方式正在被一群语音助手所取代。百度数据显示,在过去的一年半中,用户使用语音互动的频率增加了三倍。
机器翻译和其他语言处理变得越来越精确,谷歌、微软、脸书和百度每个月都没有什么进展。目前,谷歌已经能够在瞬间将普通的英语口语翻译成其他32种语言,并且在文本翻译中覆盖了103种语言,无意中成为许多即将消失的语言的守护神。与此同时,gmail的收件箱已经精心准备了三种预制回复,足以处理普通邮件。
此外,图像识别技术也取得了很大的进步。上面提到的四大巨头已经能够帮助用户在没有识别标签的情况下找到他们想要的图片。你甚至可以让他们找一些有狗、雪花甚至拥抱的照片。此外,未来的图像识别技术还将具备看图和说话的功能,可以在眨眼之间为你描述图片的内容。
然而,要达到这样的效果并不容易。首先,应用程序需要区分不同种类的狗,其次,它需要区分那些颠倒或模糊的图片。此外,图片中的背景也会形成干扰,如果出现烟雾,“宝宝”会受到影响。最后,应用程序必须排除看起来更像狗的狼和猫。这个复杂的过程是通过分析像素来完成的,这真的很神奇。
图1:神经网络如何识别图片中的狗
除了社交应用之外,图像识别技术还能处理其他领域的情感。一些医疗初创公司表示,他们将很快能够使用计算机来分析x光、核磁共振成像和计算机断层扫描的结果。整个过程将变得更快、更准确,老放射科医生将不得不让步。此外,计算机还可以提前检测癌细胞的存在,为患者争取更多的治疗时间。同时,新技术也是开发救命药物的好帮手。
机器人、无人驾驶飞行器和自动驾驶汽车也是图像识别技术的受益者,这些产品将彻底改变我们未来的生活方式。
然而,当你忙着提供你的膝盖时,恐怕你不知道它们在本质上是一个突破。背后真正的魔鬼实际上是人工智能技术,这就是我们所说的深度学习。此外,它还有一个学名叫做深层神经网络。
要说深层神经网络哪里强,恐怕其强大的自学能力才是最好的答案。随着计算机技术的发展,任何程序员都不能直接编译程序或算法来完成上述任务。他们只能为计算机创建一个学习算法,并日以继夜地向它提供数据,但是计算机本身,而不是提供数据的人,领导着学习过程,他们将在数据的海洋中漫游,独立完成学习任务。
英伟达首席执行官黄仁勋表示:“从本质上讲,软件学会了独立开发新软件。”英伟达五年前下了一个大赌注,正从一家熟悉的显卡公司转型为一家深度学习技术巨头。
事实上,深度神经网络的概念由来已久,其历史可以追溯到20世纪50年代,而大多数关键算法的突破都发生在20世纪80年代和90年代。现在,这个概念又回到了前台,主要是因为我们有强大的计算和数据存储能力,而互联网上的图片、视频、音频和文本已经成为“养料”。顶级风险投资家安德森霍洛维茨(andreessen horowitz)的合伙人弗兰克陈(Frank chen)认为,“深度学习带来了寒武纪大爆发”,各种高级生物一夜之间涌现出来。
这个巨大的转折点也点燃了许多人的激情。据研究公司cb insights称,上个季度,人工智能初创企业的融资额再创新高,超过10亿美元。2016年第二季度,这些公司完成了121轮融资,而2011年同期为21轮。在过去的五年里,投资于人工智能的资金达到了75亿美元,其中60亿是在2014年以后才被接纳的。
2012年,谷歌只有两个深度学习项目,但现在这个数字已经超过了1000个。与此同时,这些项目正在各地蓬勃发展,谷歌的搜索、安卓、gmail、翻译、地图、youtube和自动驾驶汽车都是它的受益者。
以前,ibm的沃森系统只能靠人工智能赢得各种比赛,但现在他们顺应潮流,运用深度学习。华生的30项建筑服务因这项技术而得到加强。
五年前,恐怕很少有风投知道什么是深度学习,但现在如果创业公司不知道这项技术,他们会在投资前犹豫不决。陈说:“我们生活在一个新时代。”“复杂的软件应用已经成为必须。人们将很快意识到这一巨大变化,人类之间未来的对话也将围绕着他们。”
微软研究院的彼得·李认为,许多公司已经将深度学习技术融入了他们的日常流程。“我们的销售团队正在使用神经网络来预测产品前景,并根据用户特征做出准确的建议。”
深度学习技术的快速发展也震动了硬件产品的世界。摩尔定律不再是无可辩驳的事实,英伟达的图形处理器也可以成为计算能力的倍增器。对于深度学习计算来说,这款最初用于渲染3d游戏的产品比传统cpu的效率高出20-50倍。
今年8月,英伟达最新的季度财务报告显示,其数据中心部门的收入同比增长一倍,达到1.51亿美元。该公司的首席执行官认为,“该部门的收入可以取得很大进展,主要是通过深入学习。”在83分钟的金融电话会议中,“深度学习”一词以破纪录的方式出现了81次。
芯片巨头英特尔也受到了影响。在过去的两个月里,它收购了两家从事深度学习计算的初创公司:nervana系统(超过4亿美元)和movidius(未公开价值)。
在这方面,谷歌在5月份表示,去年他们使用了一种定制的芯片——张量处理器(Texactor Processor,TPU),通过深度学习来实现应用。张量是一系列像矩阵一样的数字,在深度学习计算中经常要乘以另一个。
事实上,公司现在正处于一个转折点。百度R&D中心首席科学家安德鲁·吴(Andrew ng)表示:“过去,标准普尔500指数的许多首席执行官都希望他们首先应用互联网。我认为,未来五年将会有更多的首席执行官希望尽快应用人工智能。”
虽然互联网不能充分利用人工智能进行深度学习的价值,但安德鲁·吴说:“电的出现改变了100年前的工业时代,所以现在人工智能发挥了电的作用。”
深度学习只是一小部分。人工智能包含许多技术,如传统的逻辑算法系统,它可以使计算机和机器人像正常的人类思维一样解决问题。深度学习是机器学习的一个分支,听起来很难理解,但它是计算机根据经验解决问题的一种重要的数学算法。
百度的Ng说:“例如,深度学习就像是从A到b的映射。你可以输入音频,然后你就可以听到拷贝。”这是语音识别。只要您有运行软件的数据,就有可能完成它。”他补充道:“如果你收到一封电子邮件,它会识别出它是否是垃圾邮件。如果收到贷款申请,它将预测还款的可能性。如果你问驾驶路线,它会告诉你下一步怎么走。”
推荐阅读:
人工智能世界的历史性时刻:美国五大技术巨头共同建立了“人工智能合作伙伴”组织
就位。如何评价谷歌神经机器翻译系统?