本篇文章4453字,读完约11分钟

看看人工智能领域,中国人有多好?人工智能研究的推广有多大?

上周三,白宫科技政策办公室公布了全球人工智能领域的研究数据,称中国已经领先世界,让世界感到黯然失色。华盛顿邮报:中国在人工智能研究方面领先世界。)奥巴马还接受了《连线》杂志的独家采访,谈论美国在人工智能领域的战略和未来方向。创新工程人工智能工程研究所副所长王永刚对文章数据进行了深入分析,以了解中国人在人工智能领域的表现。人工智能研究的推广有多大?根据国家统计数据,白宫报告得出中国领先世界的结论是否科学合理?

深度丨AI领域 中国人/华人有多牛?

人工智能之火已经达到国家战略层面,甚至美国总统和政府机构都参与其中。上周四,奥巴马主持了白宫前沿峰会,展望美国未来50年的发展。在峰会期间,白宫发布了报告“国家人工智能研究和发展战略规划”(见原始链接)。你可以参考《连线》:巴拉克·奥巴马谈人工智能、自动驾驶汽车和人类的未来。(附件,文章翻译链接:http://tech.qq/a/20161014/005583)

深度丨AI领域 中国人/华人有多牛?

在过去的两天里,媒体的炒作并没有减少;就我个人而言,我对这份报告中的两个趋势图特别感兴趣。根据该报告,从2013年到2015年,在sci收录的论文中,涉及深度学习的文章数量增加了大约六倍。同时,有人强调,就文章数量而言,美国不再是世界第一。

深度丨AI领域 中国人/华人有多牛?

美国不是世界第一吗?谁是世界上第一个?请看报告中的两个趋势图:

上图显示了sci收录的文章中涉及深度学习或深度神经网络的文章数量每年的变化趋势,并按国家进行了区分。数据本身是从科学网的核心数据库中查询的。

深度丨AI领域 中国人/华人有多牛?

第二幅图与第一幅图中的其他条件相同,只是一篇文章必须至少引用一次。也就是说,第二张图片中统计的文章数量是引用的有效文章数量,这相对比较合理。

深度丨AI领域 中国人/华人有多牛?

在这两张照片中,中国在2014年和2015年超过了美国(以及所有其他二线国家),占据了领先地位。

深度丨AI领域 中国人/华人有多牛?

问题是,中国人在人工智能研究领域真的这么强吗?

多年来的直觉表明,中国人/中国人在人工智能领域有很多大牛,而吴恩达、孙健、杨强、黄光斌、马毅和张大鹏可以随意说出一长串。我自己的眼睛在谷歌的研究团队、微软研究院和其他地方也布满了中国人和中国面孔。但这只是一种直觉。总的来说,中国人对科学研究的贡献有多重要,它对人工智能有多大的促进作用?白宫报告中的统计数据是否科学合理?

深度丨AI领域 中国人/华人有多牛?

事实上,我对美国国家战略计划中的统计数据有几个问题,包括:

直接搜索关键字深层学习和深层神经网络真的能涵盖人工智能领域近年来的所有科学研究进展吗?在机器人、智能控制、机器视觉和无人驾驶等领域,有相当多的文章没有提及深度学习。严格匹配关键词会漏掉多少相关文章?它会影响统计结果吗?

深度丨AI领域 中国人/华人有多牛?

这篇文章至少被引用了一次,这是相当科学的,但似乎远远不够。在这种统计中,真的没有必要考虑sci的影响因素吗?如果你不考虑它,有多少发表在劣质期刊上的论文会被混在一起?这些数据会不会被国内研究机构用sci引用数来判断专业职称的趋势所污染?

深度丨AI领域 中国人/华人有多牛?

在全球化时代,根据国家统计,会有明显的偏差吗?白宫的报告没有提到统计的文章属于不同的国家。根据作者发表文章的机构,大量访问外国机构的中国学者会被算作外国人吗?如何统计中国人和外国人写的文章?如果期刊属于不同的国家和地区,不同国家之间期刊水平(影响因素)的差异是否会影响统计结果?

深度丨AI领域 中国人/华人有多牛?

基于此,我也想自己做统计。

在统计之前,我给自己定了几个原则:

从期刊的影响因子开始,只统计影响因子高的顶级期刊。

从科学网的关键词开始,它涵盖了所有与人工智能相关的科学研究领域,而不仅仅是关于深度学习的文章。

深度丨AI领域 中国人/华人有多牛?

关注中国人而不是用国家分类的方式来比较中国和外国是我自己的选择,因为在今天的学术界,国家之间的合作与交流是不可忽视的。像吴恩达这样的海外华人实际上为中国人工智能的发展做出了贡献。与其限制这个国家,不如看看整体,看看中国科学家和研究人员在地球上有多强大。

深度丨AI领域 中国人/华人有多牛?

关注的时间范围是从2006年到2016年,跨度约为10年,因为许多人说,这一波人工智能真正开始兴起是在2006年之后。

深度丨AI领域 中国人/华人有多牛?

我的统计结果

让我先谈谈我的统计结果,然后我将在附录一中谈谈我的统计方法

看看2006年至2016年中国作者的平均贡献:

从2006年到2016年,在近2万篇顶级人工智能论文中,中文投稿数和引文数分别占总数的29.2%和31.8%。近十年来,中国人贡献了30%的顶级人工智能研究论文,平均有五分之一的作者引用了这些论文。据统计,这已经超过了科研贡献的平均水平。

深度丨AI领域 中国人/华人有多牛?

然而,一般人无法判断中国科学家和研究人员近年来的实力。从2006年到2015年,中国人贡献的文章数量和引用数量的变化趋势是:

深度丨AI领域 中国人/华人有多牛?

从2006年到2015年,中国作者参与顶级人工智能论文的比例从23.2%逐年上升到42.8%。然而,中国作者参与的顶级人工智能论文被引次数占所有顶级人工智能论文被引次数的55.8%,从25.5%逐年增加(2016年数据较少,不用于趋势比较)。

深度丨AI领域 中国人/华人有多牛?

也就是说,即使只计算顶级出版物中的顶级文章,中国人在人工智能领域的贡献也与白宫报告中揭示的规律完全相同。从任何角度来看,中文在人工智能领域都扮演着重要的角色。此外,自2014年和2015年以来,中国人在人工智能研究中一直处于领先地位,占据了世界人工智能研究的半壁江山。

深度丨AI领域 中国人/华人有多牛?

个案分析

有人会觉得这个数据不可思议吗?这个结果会让很多人吃惊吗?我们也可以举一个更具体的例子进行深入分析。

深度丨AI领域 中国人/华人有多牛?

在顶级人工智能期刊和会议记录中,让我举一个著名的例子:ieee模式分析和机器智能事务(pami),2015年的影响因子是6.077,高到没有朋友。想在这里投稿的学生可能知道被接受和发表有多难。

深度丨AI领域 中国人/华人有多牛?

我从2006年到2016年的前500篇论文中选择了ieee模式分析和机器智能的交易,根据引用的数量。这500篇论文的引文分布如下:

深度丨AI领域 中国人/华人有多牛?

事实上,这太可怕了。前500篇文章的最高被引数为2715,最低被引数为41。这真是一本顶级杂志!普通的期刊很难找到。

深度丨AI领域 中国人/华人有多牛?

那么,中国科学家和研究人员在人工智能500强论文中的贡献是什么?让我先从几个数字开始:500篇顶级文章有1220位作者,其中316位是中国科学家和研究人员,占25.9%。所有作者单独计算的被引数之和为231,361次,其中中国科学家和研究人员被引数之和为63,846次,占27.6%。如果我们只看2014年的数据(当时中国的文章和引文数量都很高),中国科学家和研究人员的引文数量占51.8%,超过一半。

深度丨AI领域 中国人/华人有多牛?

如果你只看2006年至2016年的ieee模式分析和机器智能杂志,10位中国作者和10位引用最多的非中国作者的具体情况也是一个非常有趣的表格:

深度丨AI领域 中国人/华人有多牛?

在ieee模式分析和机器智能交易中,中国和非中国的前10大牛的人均引用总数几乎相等。事实上,在人工智能的顶尖科学家中,中国人的贡献不亚于其他科学家。

深度丨AI领域 中国人/华人有多牛?

此外,如果你不熟悉人工智能的研究领域,尤其是模式识别,记住表格中前20名科学家的名字。如果你感兴趣,你可以搜索他们的简历,看看他们在哪里工作和做研究,以及他们的学生和同事是谁。我相信会有很多发现。

深度丨AI领域 中国人/华人有多牛?

为什么?

为什么中国人在人工智能领域如此强大?因为数学很好?因为兴趣?因为思维习惯?因为勤奋?因为教育?每个人都可能有自己的答案。

深度丨AI领域 中国人/华人有多牛?

本文不想讨论,但列举了数据和事实,这就是本文的目的。

附录一:统计方法介绍

简单介绍一下我是如何得到上述比率和趋势数据的。

在周末,我首先去了科学数据库网,找到了计算机科学/人工智能的学科类别。根据2015年sci影响因子由高到低的排名,我选择了前50名的出版物(包括期刊和会议纪要)。有关人工智能领域这50种顶级期刊和会议记录的详细列表,请参见附录2。

深度丨AI领域 中国人/华人有多牛?

然后,对于每个顶级期刊和会议记录,2006年至2016年的所有文章都根据被引用的文章数量进行排序。在此期间,期刊和会议记录中发表的文章平均数量约为500篇。我把500作为上限,并把每个期刊和会议记录中引用最多的文章,增加到500篇。从2006年到2016年,共获得19,855篇与人工智能相关的顶级论文。

深度丨AI领域 中国人/华人有多牛?

然后,根据作者名单和被引论文数量,统计中国科学家、研究人员与论文所有作者之间的比例和趋势关系。

深度丨AI领域 中国人/华人有多牛?

如何识别中国作者?似乎没有特别好的办法。我的方法是根据英文名字来判断。如果英文姓名主要由中文拼音、韦伯斯特拼音或粤语拼音组成(当然,在英文表达中的姓和名之间的差异以及其他经验规则也应予以考虑),则假定作者是中国血统。通过对小样本集的验证,该方法的准确率在96%以上,召回率在90%左右。也就是说,会有一定数量的遗漏和少量的误解,但它们基本上能反映整体情况和趋势。

深度丨AI领域 中国人/华人有多牛?

如何解决合作伙伴的问题?我单独计数,不增加重量。第一作者与其他作者分享文章数量和引用数量。增加第一作者的权重会影响总体统计结果吗?也许吧,但这不会影响总体趋势数据,因为没有证据表明中国人或非中国人更经常是第一作者。至于每个作者的文章数和被引数,无论是采用简单累加还是比例累加(例如,如果两个人合作,每个人的贡献是0.5或1),我对整个数据集做了一个比较实验,这几乎不影响整体结果。

深度丨AI领域 中国人/华人有多牛?

附录二:出版物名称及影响因素

按影响因素排序的前50名人工智能期刊和会议纪要列表;

ieee模糊系统交易,6.701

国际神经系统杂志,6.085

ieee模式分析和机器智能交易,6.077

ieee进化计算交易,5.908

综合计算机辅助工程,4.981

ieee控制论交易,4.943

ieee神经网络和学习系统交易,4.854

医学图像分析,4.565

信息融合4.353

国际计算机视觉杂志,4.27

ieee图像处理交易,3.735

ieee计算智能杂志,3.647

进化计算,3.6

ieee智能系统,3.532

模式识别,3.399

人工智能,3.333

知识型系统,3.325

神经网络,3.216

应用专家系统,2.981

群体和进化计算,2.963

应用软计算,2.857

数据挖掘和知识发现,2.714

国际近似推理杂志,2.696

暹罗影像科学杂志,2.687

决策支持系统,2.604

群体智能,2.577

模糊优化和决策,2.569

ieee知识和数据工程交易,2.476

机器学习研究杂志,2.45

acm智能系统和技术交易,2.414

神经计算,2.392

人工智能的工程应用,2.368

化学计量学和智能实验室系统,2.217

医学中的人工智能,2.142

计算机视觉和图像理解,2.134

自动推理杂志,2.113

国际智能系统杂志,2.05

计算语言学,2.017

高级工程信息学,2

智能制造杂志,1.995

认知计算,1.933

ieee情感计算交易,1.873

化学计量学杂志,1.873

机电一体化,1.871

ieee人机系统交易,1.8

语义网,1.786

图像和视觉计算,1.766

威利跨学科评论-数据挖掘和知识发现,1.759

神经处理字母,1.747

人工智能评论,1.731

来源:罗盘报中文网

标题:深度丨AI领域 中国人/华人有多牛?

地址:http://www.lzn4.com/lpbxw/12927.html