重磅 今日头条机器联合发布:斯坦福AI指数2017年度报告中文版

2018-06-29 08:25

  原标题:重磅 今日头条&机器联合发布:斯坦福AI指数2017年度报告中文版 机器发布

  原标题:重磅 今日头条&机器联合发布:斯坦福AI指数2017年度报告中文版

  由斯坦福大学人工智能百年研究(AI100)推出的「人工智能指数」(AI Index)是一个追踪 人工智能行业动态与发展的非营利性项目,其研究覆盖了百年以来人工智能的总体情况, 目标是基于数据来推动人工智能的广泛交流和有效对线 年,AI Index 推出了首份年度报告,从多个角度观察和解读了人工智能领域的动态和进展。 经「人工智能指数」项目委员会授权,今日头条联合机器对此报告做了中文翻译(错误由翻译方负责),中文版报告近期正式发布。

  下图统计了 Scopus 学术论文库中标注关键词「人工智能」的计算科学论文数量。

  这里是各类学术论文年发表率与其 1996 年发表率的比较。图表显示了各领域论文、 计算机科学领域论文以及计算机领域内人工智能论文年发表率的增速。

  数据了人工智能论文发表率的增长不仅仅是出于对更广泛计算机科学领域兴趣的 增长。具体来说,尽管自 1996 年以来整体计算机科学领域内的论文数量已经增长了 6 倍,同时期人工智能领域每年发表的论文数量已经增长了 9 倍多。

  除了论文发表数以外,课程的参与人数也能体现这个领域的活力。以下展示的是斯坦 福大学每年选修人工智能与机器学习导论课程的学生数量。机器学习是人工智能的子领域。我们着重关注机器学习导论课程的参与度是因为目前人工 智能领域很多都基于机器学习的算法与理论。

  自 1996 年以来,选修斯坦福大学人工智能导论课程的人数已经增长了 11 倍。

  注:斯坦福大学 2016 学年机器学习入学人数的下降是基于当年的行政问题而非学生兴趣。详情请见附录。

  本报告之所以着重突出斯坦福大学导论课程的选修人数是因为其数据最全面。不过如下所示,其它高校导论课程的选修趋势也与斯坦福相似。

  注:许多大学从上世纪 90 年代起开设人工智能课程。上图展示的是可获取数据的年份的情况。

  注:许多大学从上世纪 90 年代起开设机器学习课程。上图展示的是可获取数据的年份的情况。

  需要注意的是,这些图表展示了高等教育领域中的一个侧面,这些数据并不一定代表 学术机构总体的发展趋势。

  以下展示了人工智能领域有代表性的学术会议的参会情况,其中既有如 AAAI、IJCAI 和 ICML 这样的大型综合性会议 (按 2016 年参会人数超过 1000 人为标准),也有像 CVPR、ACL、ICRA 那样专注于计算机视觉、自然语言处理和机器人的小型会议 (2016 年参 会人数不足 1000 人)。

  注:大多数学术会议自 1980 年代起即开始举办,上图展示的是参会人数有记录的年份的情况。

  研究重心转移:上图的参会人数同样表明了研究重点已经从符号推理转向了机器学习与深 度学习。

  下图展示了参会人数少于 1000 人的小型学术会议的参会情况,其中需要注意的是 ICLR,该会议专注于深度学习领域,第一次会议于 2013 年由深度学习 Yann LeCun 及 Yoshua Bengio 主办。

  稳步前进:尽管学术界研究重点近年来已转移至机器学习及深度学习,仍有一小部分 研究者继续在符号推理方法上进行探索并取得进展。

  下图展示了得到风投资本支持并开发了人工智能系统的美国活跃创业公司的数量。

  下图分别展示了两个在线招聘网站 Indeed 和 Monster 上需要人工智能技能的工作数量的增 长。我们通过标题和工作描述的关键词区分出需要人工智能技能的工作。

  下图是 Indeed 网站上美国需要人工智能技能的工作数量的增长数据。涨幅是基于 2013 年 1 月 Indeed 网站上美国要求人工智能技能的就业岗位所占份额的增长倍数。

  自 2013 年以来,在美国需要人工智能技能的工作比重增长了 4.5 倍。

  注:虽然在和英国 人工智能就业市场增长很快,但(称相对来说它们在 绝对规模上仍然只有美国 AI 就业市场的 5% 和 27%。

  下图为 Monster 平台发布的按照所需的特定技能划分的一年内人工智能工作机会总量。

  注:一份与人工智能相关的工作可能出现被计算两次的情况 (属于不同的类别)。比如,一份工作可能尤其需要自然语言处理和计算机视觉两种技能。

  软件开发者在 GitHub 上收藏 (Star) 软件项目以表示感兴趣并希望快速至该项目。收藏 可以代表开发者对软件和软件使用的兴趣。

  下图展示了包含关键词「人工智能」的大众文章的百分比,文章根据其意见倾向性 被分为正面报道或负面报道。

  注:VQA 1.0 数据集已经被 VQA 2.0 数据集超越,目前尚不明确 VQA 1.0 数据集在未来会 获得多少关注。

  可处理度 (tractability) 是指自动证明器在大量的数据集上的平均可处理程度。它可 以被用来衡量部分最先进的自动证明器。参见附录以获取与「可处理度」有关的更多信息。

  注:引进最先进的证明器虽然可以解决新问题,但由于其在处理其他证明器擅长解决的问题上表现糟糕,平均可处理度可能会下降。

  这里指的是 SAT 求解系统解决问题 (那些可应用到产业实践中的问题) 的百分比。

  通过研究不同流行趋势之间的关系,我们可以从前述章节中的评估中获得进一步的领 悟。本章展示了人工智能指数收集的数据可以如何被应用到进一步的分析中,以及这些数 据如何推动了一个全新、精确的衡量指标的发展。

  由于这是一个案例研究板块,我们会着眼于横跨学术圈与产业界的流行趋势去探究其 之间的动态关系。进一步,我们会将这些标准整合成一个联合的人工智能活力指数。

  为了研究学术界与产业界人工智能相关活动的关系,我们首先从之前章节中选择了部 分具有代表性的评估结果。特别地,我们考察了人工智能论文的发布情况与斯坦福大学人 工智能与机器学习导论课程的修读情况,此外还考察了风投资本对人工智能创业公司的投 资情况。

  论文发表数、注册学生数和投资金额这些数量指标并不能直接比较。为了分析这些趋 势之间的关系,我们首先以 2000 年为起始为每个测量指标设定了时间标准。这使得我们 可以来比较这些指标随时间的增长情况变化,而不是仅仅从最后的绝对值入手分析。

  注:注册学生数在 2016 年有所下降,这反映了学校行政上的某些问题,并非没有足够的学生对课程感兴趣。具体细节可参考附录 A2。

  数据显示,首先,学术活动数量 (论文发表与注册学生数) 在稳步上升。在 2010 年 左右,投资者便开始注意到了这个领域,到 2013 年,投资者已经成为了推进该领域发展 的核心驱动力。此后,学术界逐渐赶上了产业界的步伐。

  人工智能活力指数整合了来自学术界和产业界的各类数据 (论文发表量、课程注册学 生数、风险资本投资) 来量化整个人工智能领域的活力。为了计算人工智能活力指数,我 们按照时间对来自论文发表、学生课程注册和投资领域的数据进行了归一化平均处理。

  我们希望这份简要调查可以激发大家在研究如何进一步分析人工智能指数中数据类别 方面的兴趣,也希望可以引起讨论来研究出一个可以长期追踪的有价值的测量方法。

新闻排行

随机阅读