人工智能爆发原因探讨
下面,就让我们追溯过去,简单探讨一下人工智能爆发所需要的种种环境和条件。任何一项技术的普及,被千家万户所熟知、接触乃至使用,都离不开其廉价生产成本和使用成本,而不仅仅在于这项技术取得了多么辉煌的成果。下面将会从这一角度出发,进行相关的探讨。
一、深度学习技术的发展奠定理论基础
时间回溯到10年前,2006年,加拿大多伦多大学教授、机器学习领域泰斗、神经网络之父——Geoffrey Hinton 和他的学生Ruslan Salakhutdinov 在顶尖学术刊物《科学》上发表了一篇文章,该文章提出了深层网络训练中梯度消失问题的解决方案:无监督预训练对权值进行初始化+有监督训练微调。从此,深度学习成为了众多人工智能领域中最有潜力的一部分,斯坦福大学、纽约大学、加拿大蒙特利尔大学等成为研究深度学习的重镇,至此开启了深度学习在学术界和工业界的浪潮,人工智能也迎来了其最近的一次爆发期。而2006年,也被称为深度学习元年。
在人工智能的发展史上,AlphaGo大战李世石并非人工智能在智力比赛中战胜人类的首例,但却是证明了人工智能能够达到如同人类大脑一般思考的重要事件。早在1997年,IBM的人工智能Deep Blue就在国际象棋上战胜过世界冠军Garry Kasparov,但这并不能证明人工智能的潜力,因为当时的Deep Blue是使用穷举的方法来达到国际象棋的最优解的,与人类的经验和直觉相差甚远。而Hinton所解决的深度学习这一技术的难题,正是人工智能真正向人类智能靠近的重要一步,AlphaGo也正是仰赖于深度学习技术才能够在围棋大战上大放异彩。
随着时间的推移,基于深度学习的研究成果不断涌现,在图像识别、文本处理和语音识别上取得大量足以商业化应用的技术进步。
2011年,ReLU激活函数被提出,该激活函数能够有效的抑制梯度消失问题。2011年以来,微软首次将DL应用在语音识别上,取得了重大突破。微软研究院和Google的语音识别研究人员先后采用DNN技术降低语音识别错误率20%~30%,是语音识别领域十多年来最大的突破性进展。2012年,DNN技术在图像识别领域取得惊人的效果,在ImageNet评测上将错误率从26%降低到15%。在这一年,DNN还被应用于制药公司的DrugeActivity预测问题,并获得世界最好成绩。
2012年,Hinton课题组为了证明深度学习的潜力,首次参加ImageNet图像识别比赛,其通过构建的CNN网络AlexNet一举夺得冠军,且碾压第二名(SVM方法)的分类性能。也正是由于该比赛,CNN吸引到了众多研究者的注意。
2014年,Facebook基于深度学习技术的DeepFace项目,在人脸识别方面的准确率已经能达到97%以上,跟人类识别的准确率几乎没有差别。这样的结果也再一次证明了深度学习算法在图像识别方面的一骑绝尘。
但是,技术想要走进千家万户,光有理论成果还是不足的,不但要理论成为现实,而且还需要理论能够低成本的成为现实。下面几点会从这个角度出发进行探讨。
二、互联网时代的成熟使采集大量数据的成本变得廉价
说到深度学习,不得不说到要想在深度学习方面取得成果,必须先要有大量数据作为先验知识的支撑。目前来说,深度学习应用最广泛的方面,说白了就是从大量已经有标注的数据中获得像人类经验一般的知识,然后再将这些知识应用到新的同类数据之中。人工智能还无法做到完全像人类一样只需要通过教育和自学就能够获得知识,因此能够被用户所使用的人工智能成果在产生之前,技术研究人员必须首先采集大量的用户数据。而互联网时代的到来,使得用户数据的采集变得越来越廉价。
2000 年,Jimmy Wales 和Larry Sanger 共同成立Wikipedia,这是全球首个开源、在线、协作而成的百科全书,完全不同于《大英百科全书》的编撰方式。Wiki 的用户在第一年就贡献了20000 个在线词条。
2002 年,Friendster 上线,这是首家用户规模达到100 万的社交网络。Friendster 开创了通过个人主页进行交友的先河。
2003 年,面向青少年和青年群体的MySpace 上线,它再一次刷新了社交网络的成长速度:一个月注册量突破100 万。
2004 年,Facebook 成立,根据Facebook上市后的首份财报,Facebook 每月有9.55 亿用户活跃用户(MAU),每月移动平台活跃用户数有5.43 亿。
2004 年同年创立的还有flickr,现在它依然是非常活跃的图片社区。2005 年,YouTube 成立。2006年,Twitter 成立。两者的用户量和数据量当然不用怀疑了。2006年成立的还有Spotify,它现在是社交音乐分享型应用的典型,拥有1500 万MAU 和400 万付费用户。2007 年,轻博客平台Tumblr 成立,目前该平台上有7700 万个博客;根据2011 年7 月的数据,该网站每月的独立访问量是1340 万。
社交网络的发展使人们逐渐把自身的社交信息同时汇聚到几个大的社交平台上,而电商的发展使全球的买家和卖家聚集到几个巨型网络购物平台上,提供大量购物偏好和购买习惯的信息以及商品的信息。拥有这些平台的大公司可以轻易获取到PB级别的巨量数据,作为训练数据放入机器学习算法中去,从而获得相关的人工智能成果。
虽然这些大公司曾发生未经用户许可擅自使用用户数据从而侵犯用户隐私权的事件,因此引发社交网络的信任危机。但是隐私方面的问题并非本文讨论的重点,因此略过。
三、存储巨量数据的成本降低,深度学习成本进一步下降
获得数据的成本降低了,但是巨量的数据同时意味着庞大的存储需求。而庆幸的是,在深度学习教父hinton解决深度学习难题的前后,大规模数据存储设备出现了,并且,存储的成本也经历了快速的下降,对TB级别数据的存储设备也可以被普通消费者所购买到,存储设备的读写速度和带宽也飞速增大。这意味着,任何人都可以把从互联网上或者其他途径获得的大量数据存储起来,用作机器学习训练或者其他用途。
2003年1月,日立宣布完成20.5亿美元的收购IBM硬盘事业部计划,并成立日立环球存储科技公司(Hitachi Global Storage Technologies, Hitachi GST)。
2005年日立环储和希捷都宣布了将开始大量采用磁盘垂直写入技术(perpendicular recording),该原理是将平行于盘片的磁场方向改变为垂直(90度),更充分地利用的存储空间。
2007年1月,日立环球存储科技宣布将会发售全球首只1TB的硬盘。硬盘的售价为399美元,平均每美分可以购得27.5MB硬盘空间。
2018年的今天,1TB的大容量硬盘已经普及到每一台PC机上,人们随身携带的手机上都有着上百GB的存储容量。最流行的用作机器学习训练的数据集imagenet包含约120万张训练图像、5万张验证图像和10万张测试图像,分为1000个不同的类别,达到140GB以上,但是现在的人们不仅可以把这些数据直接放在家里的PC上,甚至可以用移动硬盘带在身上到处走。
时至2016年alpha go横空出世的时候,存储的世界不再是传统机械硬盘hdd的时代,而逐渐显示出读写速度更快的固态硬盘ssd将会替代hdd的趋势,容量更大、质量更高的存储的价格也持续的变得更加的便宜。
四、摩尔定律持续了半个世纪,gpu计算框架横空出世,计算能力变得越来越廉价
摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的。其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。这一定律从被提出的一刻开始,预言了未来半个世纪信息技术进步的速度,同时也显示出计算能力在半个世纪内在同一价格水平上经历了34次的翻倍提升。
而在2010年之后,cpu算力增长出现明显的放缓,但GPU类处理器内部的晶体管数量还保持着快速增长的势头,大有从cpu手中接过摩尔定律大旗的态势。
人工智能研究人员进行每一次的深度学习研究过程中的算法训练,都离不开大规模计算能力的支撑。而在cpu经历了半个世纪的进化迭代之后,在支持深度学习的训练方面仍然称不上足够廉价。而在NVIDIA于2008年开始打造CUDA架构之后,GPU的用途已经发生了翻天覆地的变化。长久以来受限于CPU处理能力的人工智能也在那个时刻找到了更加适合的源动力,并且凭借GPU的性能不断提升,极大的拓展了人工智能的能力和适用范围。
按照传统方案,云服务商可以采购4个机架、共160个CPU服务器,在功耗65千瓦的情况下提供每秒45000张照片的处理能力。而如果换成NVIDIA的产品,只需要一个装有8片V100 GPU的NVIDIA HGX服务器,同样的每秒45000张照片处理能力,但是你只需要7个服务器插槽,总共的功耗也只有3个千瓦。
明显的数字对比,背后是对于企业来说的巨大的采购和运营成本差距。而对于个人来说,在学习深度学习时进行算法训练所需要的庞大计算能力,也由于GPU对深度学习的友好支持变得触手可及。大型3D游戏行业的发展使得台式游戏机的价格变得普通家庭都可以承受,而每台台式游戏机的配置中只要包含CUDA 计算能力为3.0 或更高的GPU 卡,就可以搭建支持深度学习的计算环境。深度学习和人工智能的入门成本变得无比低廉,让无数人才可以通过培训机构甚至自学进入人工智能这个正在飞速发展的行业,无数的人工智能创业项目也得以基于小额的创投资金启动起来,进一步促进人工智能行业的繁荣,从而吸引更多的投资进入这个行业,形成一个良性的循环。
总结:
这一切都使人工智能的推广变得没有那么困难,人工智能的研究再也不是特定大公司或者政府赞助机构的专利。任何一个行业的繁荣都不可能只由一两家大公司营造出来,而需要由数量众多的大小公司、无数的人才和创意以及大额的投资共同去促进整个行业不断生产出更多足以改变人类生活的发明和发现。目前的人工智能行业已经具备了持续爆发性发展的环境和条件,也正处于持续上升期中。有理由去相信,这次的人工智能爆发和之前的新能源、VR以及智能硬件不同,能够最终成长到可以改变普通人的生活的方方面面,迈出人类工业革命性的一步。
文章参考:
ü 百度百科:图形处理器
ü 依图科技:当摩尔定律面临失效,我们或许可以建立一个行星级的智能系统
ü 徐鑫:两年股价涨十倍,英伟达用芯片绑架了整个人工智能圈子
ü 百度百科:戈登摩尔
ü 李赓:黄仁勋:GPU才是AI时代的摩尔定律
ü 机器之心: CVPR 2017 李飞飞总结8 年ImageNet 历史,宣布挑战赛最终归于Kaggle
ü 快科技:数据解读2011-2016年全球SSD发展史
ü 天空蔚蓝:硬盘15年发展沧桑:容量成长远胜于性能的建树
ü 百度百科:社交网络