(报告出品方/作者:安信证券,焦娟、夏瀛韬)
1.人工智能:将“人”由现实映射到虚拟世界的技术脉络之一
人工智能的本质是希望计算机具备像人类一样感知、处理与分析问题的能力。从人类应对外界刺激所作出的反馈的流程来看,大概需要以下三步:1)通过眼睛、耳朵等感官获得外界刺激;2)将信息传输至大脑进行处理,并基于大脑的处理结果与此前的经验积累,做出判断;3)借助语言进行表达或者指导手、脚等四肢做出行动,对外界刺激做出反馈或者进行互动。
参考人类处理问题的流程与能力来看,人工智能系统应当具备的三大核心模块为:
1)感知模块:类似于人类的眼睛、耳朵等感官一样,人工智能需要借助摄像头、传感器等进行图像、声音等信息的收集,并将其传输至像大脑一样的数据处理中枢进行信息处理;
2)思考模块:类似于人类大脑,人工智能应该有数据处理中心对所收集的数据进行处理分析,人类根据大脑处理后的信息,并基于一定的经验与知识对所处的环境进行判断,并最终做出决策,所以在人工智能中,需要对计算机进行大规模的数据训练,使其具备一定的知识积累,产生类似于人类的“经验”,从而具备对新接收的数据进行分析和判断的能力;
3)行动模块:在做出判断后,人类通过语言或行动对外界做出反馈,那么人工智能则需要借助语音输出或向硬件设备等发出信号指导其行动,对应语音合成等技术。
根据计算机所具备的能力,我们可以将其发展阶段划分为计算智能、感知智能、认知智能这三个阶段:1)计算智能:计算机能够实现存储与计算,并作为传输信息的重要手段,比如在过去一段时间内,计算机最大的发展是将一切信息都尽可能的数字化,从早期的计算与文字,到发展至今的电商、娱乐等场景的数字化;2)感知智能:计算机开始看懂与听懂,并能够做出一些判断及行动,比如Siri语音助手等;3)认知智能:机器能够像人一样进行思考,并主动的做出行动,比如在完全自动驾驶场景下,汽车能够自己做出超车、转弯的行动等。
站在当前时点来看,现实世界的数字化不断深入,我们认为计算机已经基本具备了计算智能,当前阶段是帮助计算机从计算智能进一步走向感知智能,能够看懂与听懂外界环境并做出一定的反馈;并随着知识的积累所带来的智能化的提升,使计算机由感知智能逐步向认知智能的阶段进行演进。
移动互联网之后,新一轮现实映射到虚拟世界的探索中,我们认为硬件与AI分别是两种技术脉络。硬件实时传输与人体机能相关的弯曲、力度、触感;AI模拟人的大脑对人行为、动作、表情的驱动。这两种技术脉络的结合应用,预计将开启此轮探索的软硬一体化的运行特质。
2.奠定当下的商业化的理论知识,可以追溯到70年前
2.1.-年:理论知识积累的时期,相关研究进展缓慢
回顾人工智能早期发展史,其可以追溯至年,直至年之前由于当时的算力受限且数据不足,算法没办法充分发挥其作用,这一阶段主要是人工智能理论知识的启蒙与积累阶段,期间也曾产生一些阶段性成果,但整体研究进展较为缓慢。其中,一些典型的理论积累如下:
思想启蒙:年,沃伦〃麦卡洛克和沃尔特〃皮茨发表了《神经活动中内在思想的逻辑演算》,这启发了后来神经网络和深度学习的产生。年著名的图灵测试诞生,按照“人工智能之父”艾伦〃图灵的定义:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。年夏天,美国达特茅斯学院举行了历史上第一次人工智能研讨会,被认为是人工智能诞生的标志。会上,麦卡锡首次提出了“人工智能”这个概念,纽厄尔和西蒙则展示了编写的逻辑理论机器。
从推理期至知识期,期间推出大量专家系统。20世纪50-70年代,人们认为如果能赋予计算机推理能力,机器就有智能,人工智能研究处于“推理期”,之后人们意识到人类能够进行判断、决策还需要知识,人工智能在70年代进入“知识期”,诞生了大量的专家系统如Dendral,但由于当时的计算机有限的内存和处理速度不足以解决任何实际的人工智能问题,导致研究缺乏进展,美国和英国相继缩减经费支持,人工智能进入第一次低谷。
第五代计算机项目:年,日本经济产业省拨款8.5亿美元用以研发第五代计算机项目,在当时被叫做人工智能计算机。随后,英国、美国纷纷响应,开始向信息技术领域的研究提供大量资金。但是专家系统的实用性仅仅局限于某些特定情景。到了上世纪80年代晚期,美国国防部高级研究计划局(DARPA)的新任领导认为人工智能并非“下一个浪潮”,拨款将倾向于那些看起来更容易出成果的项目;此外第五代计算机项目宣告失败,人工智能进入第二次低谷期。
2.2.-年:算法、算力与数据三重合力推动,人工智能取得重大突破
人工智能算法的开发通常离不开三个核心要素,即算法、算力、数据。-年这十年间,这三大核心要素均迎来了质的飞跃:
第一重飞跃:深度学习算法能够支持训练更大规模的神经网络。深度学习算法能够训练更大规模的神经网络年GeoffreyHinton和他的学生RuslanSalakhutdinov在《科学》上发表文章,给出多层神经网络更好训练方法,至此神经网络算法才开始真正具有深度。与过去传统的人工智能算法相比,深度学习算法能够训练更大规模的神经网络,从而解决更复杂的问题,而且随着数据规模的提升,规模越大的神经网络的深度学习算法表现出的效果越显著。
第二重飞跃:芯片发展遵循摩尔定律,算力得到质的提升。摩尔定律指出芯片上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。年世界上第一台计算机ENIAC的速度是能在一秒内完成次定点的加减法运算,到年采用英特尔酷睿芯片的个人电脑计算速度为每秒亿次浮点运算,是ENIAC的万倍,体积和耗电量却小了很多;到年全球最快的计算机IBM的红杉的计算速度为1.6亿亿次,比19个月前竟提高了将近6倍。(数据来源:吴*《浪潮之巅》)通过以上几组数据可以发现,自年GeoffreyHinton发布有关深度学习的文章后,计算机的算力得到了质的提升,可以有效的支撑大规模的模型训练。
第三重飞跃:PC互联网与移动互联网的发展为人工智能模型训练提供了庞大的数据积累。PC互联网的发展使用户的许多场景线上化,比如新闻讯息、邮件、电商等,产生了相当规模的数据;而移动互联网又进一步地将智能手机等更多终端纳入互联网体系,并产生丰富新的应用,使数据规模得到了进一步地增长。根据IDC预测,全球数据圈将从年的33ZB增至年的ZB。
三重合力推动人工智能在多领域取得技术突破,逐步开始具有商业价值。在更强大的算力支撑下,通过大规模训练数据喂养的深度学习算法模型表现出更优异的效果,推动计算机视觉、语音识别等领域取得了重大的技术突破,比如年香港中文大学汤晓鸥教授团队发布DeepID系列人脸识别算法准确率达到98.52%,全球首次超过人眼识别率,突破了工业化应用红线;根据易观数据,年深度神经网络算法被应用于语音识别领域时,语音识别准确率突破90%,至年百度、搜狗等头部公司都先后宣布其语音识别率达到了97%。这一阶段,人工智能开始呈现出一定的应用价值,开始逐步走向商业化。
2.3.年至今:人工智能全面走向商业化应用,中国在应用场景优势突出
AlphaGo打败李世石进一步推动人工智能走向大众,并引爆了资本的热情。年AlphaGo打败了人类围棋世界冠*李世石,引发了全世界的