余扬：人工智能六十年党建期刊 -齐齐哈尔市第一医院

余扬：人工智能六十年

《中国发展观察》

字号： + - 16

原标题：人工智能六十年
       繁荣与寒冬

       2016年恰好是人工智能发展60周年。人工智能的标志性事件是1956年在美国Dartmouth大学召开的一个为期两个月的会议。在会议上，来自美国几个大学和企业的10位年轻人聚在一起，从不同角度讨论用计算机来实现人的一些能力。会议提出用“人工智能”来命名所讨论的内容，这成为人工智能研究公认的起始事件，而该会议也被赋予了专称——“Dartmouth会议”。后来，从参会的年轻人中，走出了四位计算机科学最高奖“ACM/图灵奖”得主、一位诺贝尔经济学奖得主，并且创立了“信息论”。

       人工智能发展的第一个阶段大约在20世纪60年代初到70年代中期。在这一阶段，人们认为逻辑推理能力是机器具有智能的重要成分，甚至一度认为推理就是智能。这一阶段的代表性工作主要有A.Newell和H.Simon两位后来的图灵奖得主研发的“逻辑理论家”程序，该程序在1952年证明了著名数学家罗素和怀特海的名著《数学原理》中的38条定理，并在此11年后证明了全部的52条定理，而且定理2.85甚至比罗素和怀特海的证明更加巧妙，令人惊叹。因此，这一时期可以称为“推理期”。

       随着研究的推进，人们逐渐认识到，单靠逻辑推理能力远不足以实现人工智能，以E.A. Feigenbaum为代表的学者认为，知识是有智能的机器所必备的，于是在他们的倡导下，在20世纪70年代中后期，人工智能进入了“知识期”，E.A.Feigenbaum后来被称为“知识工程”之父。在人工智能“知识期”，大量专家系统问世，在很多领域做出了巨大贡献。但这些系统中的知识，大多是人们总结出来并手工输入计算机的，机器能进行多少推断完全由人工输入了多少知识决定，也因此有这么一句对人工智能的调侃：“有多少人工就有多少智能”。之后，人们意识到专家系统面临“知识工程瓶颈”，寻找专家来输入大量知识一方面成本极高，另一方面，对一个特定领域建立的系统无法用在其他领域中，缺乏通用性。于是，一些学者尝试让机器自己来通过学习得到知识，而不依赖于人工输入，这就是人工智能现在所处的“学习期”——从数据中学习到有价值的知识。

       人工智能从“推理期”到“学习期”，走的并不是康庄大道，而是崎岖山路。在“推理期”的高峰，一些进展让人们对人工智能过于乐观，产生了不切实际的想法。A.Newell和H. Simon曾在1958年预言，1968年前计算机将成为世界象棋冠军（实际是1997年，将近30年后）。

       对人工智能的过于乐观导致了人们过高的期望，而当时的人工智能只能解决“玩具”问题，难以在现实问题中发挥作用，一时间，预言失败、承诺无法实现、期望破灭，人工智能遭遇了误解和冷遇，研究经费也被大量削减甚至取消，人工智能进入被称为“AI Winter”的人工智能之冬。

       进入“知识期”后，从1980年代开始，由于专家系统得到应用，人工智能才再次受到关注。这一时期，日本开始巨额投资“第五代计算机”计划，英国、美国也启动了相应的投资项目，人工智能被推进了第二次繁荣。然而在1980年代末，“知识期”人工智能技术局限日益突出，专家系统维护困难、弱点不断暴露，日本五代机计划破产，人工智能第二次进入冬天。

       直到1990年代中期，进入“学习期”的人工智能开始从数据中学习知识，通用的学习方法在许多商业应用中显示出无可替代的价值，人工智能再度掀起浪潮。此时，我们正处于人工智能“学习期”的浪潮之巅。

       为什么是AlphaGo

       棋类游戏通常被认为是人类智慧的浓缩，常常被用于开发儿童智力，因此，对于追求智力的人工智能，棋类游戏一直被作为检验其智能程度的试金石。

       早在1951年，研究者们就设计了西洋跳棋程序。1997年，IBM“深蓝”击败国际象棋世界冠军，举世瞩目。而在“完全信息”棋类游戏（即没有隐藏信息，例如扑克、麻将不属于此类）中，围棋是最难的，也是之前唯一没有被机器攻破的。甚至在一年前，还没有任何围棋程序能够达到职业棋手水平。因此，AlphaGo战胜曾获得世界冠军的人类九段围棋高手，在人工智能历史上记下了重重一笔。

       下棋的本质是搜索，通过交替思考自己和对方可能的走法，找到最有利于自己的落子。AlphaGo的基础框架是“蒙特卡洛树搜索”，是一种聪明的搜索算法，但即使该算法已经聪明地避免了很多无效搜索，也只能达到业余五段、六段的水平。AlphaGo还引入了“机器学习”，通过学习人类历史上高手对弈的棋局数据，对人类的走法进行模拟：记住人类看到一盘棋是如何走下一步的，当碰到没有见过的棋局时，则参考以往相似的棋局，但它完全不懂得人为何要下这一步。进一步，AlphaGo通过“强化学习”，即自己与自己下棋来提高自己。许多人惊讶于这种类似于“左右手互博”的学习机制，但这早在20年前就有。实际上，只要使用“强化学习”来训练对弈游戏，都是“左右手互博”。最终学习得到的模型，被用在“蒙特卡洛树搜索”中，来为一盘棋的好坏做出较为精确的评估，指导避免更多的无效搜索，从而能够在短时间内看得更远、看得更准，找到更好的走法。

       AlphaGo涉及的所有算法部件都是现成的，其“蒙特卡洛树搜索”已经发展了十年，其学习模型CNN成形于上世纪，被大量使用在图像识别也有多年，强化学习也是经历了数十年的发展，大量应用在机器人控制等领域。这些技术的结合在近年也成为研究热点。AlphaGo的贡献在于使用卓越的工程水平，实现了这些技术的结合，用上千CPU和上百显卡进行加速计算，最终取得了与人匹敌的围棋能力。
       我们一方面肯定AlphaGo展现的实力，一方面还要注意到，其中涉及的人工智能技术，都是许多年基础研究的成果，并不是突然就从平地冒出来的。未来人工智能的发展也会如此，今天有哪些积累，未来才会有哪些突破。

       人工智能的下一步

       人工智能已经进入人们的生活，正试图让生活变得更美好。例如，美国DARPA支持的CALO研究计划所产生的一个成果——SIRI个人助理，已绑定在苹果的手机等产品中，能支持用户在简单的任务上使用自然语言与系统进行交互；微软也推出了Cortana智能助理用于Windows产品；微软翻译工具内置到了通讯软件Skype中，可以在Skype聊天时实时翻译汉、英、法、德、意、西、葡等7种语言；自动驾驶汽车也在蓬勃发展。可以预见，人工智能将成为越来越有力的工具，更好地服务人类。

       然而目前，人工智能技术的瓶颈仍有很多。例如，在人工智能顶级国际会议AAAI’16大会上，国际人工智能协会主席T. G. Dietterich发表主席报告，针对目前人工智能技术缺乏稳健性（例如AlphaGo对战李世石第四局时下出多步臭棋），指出了“稳健人工智能”的发展方向。

       在社会环境方面，人工智能最近可能要面临更大的瓶颈是，由“人工智能科幻”而导致的“人工智能威胁”论不断出现。事实上，正如Facebook人工智能实验室负责人LeCun最近所说，“有些人是因为对人工智能的原理不理解导致恐惧，有些人是为了个人名望宣扬人工智能威胁论，而有些人是为了商业的利益推动人工智能威胁论”。

       另一方面，人工智能发展历史上经历了多次繁荣和低谷的交替。在每一次人工智能的繁荣期，人们往往在取得一些进步后就对人工智能技术的发展盲目乐观，逐渐产生了不切实际的预期和承诺，最终带来的沮丧是导致人工智能进入低谷的直接原因。对于人工智能未来的发展，抱以信心的同时还需冷静对待，防止过大的起伏造成的不利影响。

       （作者系南京大学计算科学与技术系副教授，主要研究方向为人工智能、机器学习等）

责任人编辑：沈王一、谢磊

标签：

上一篇：人类进入与人工智能共舞的时代

下一篇：人工智能与博弈论——从阿尔法围棋谈起

为惠及民生再助力 ——齐齐哈尔市…