余扬:人工智能六十年

《中国发展观察》

字号: + - 16

原标题:人工智能六十年
       繁荣与寒冬

       2016年恰好是人工智能发展60周年。人工智能的标志性事件是1956年在美国Dartmouth大学召开的一个为期两个月的会议。在会议上,来自美国几个大学和企业的10位年轻人聚在一起,从不同角度讨论用计算机来实现人的一些能力。会议提出用“人工智能”来命名所讨论的内容,这成为人工智能研究公认的起始事件,而该会议也被赋予了专称——“Dartmouth会议”。后来,从参会的年轻人中,走出了四位计算机科学最高奖“ACM/图灵奖”得主、一位诺贝尔经济学奖得主,并且创立了“信息论”。

       人工智能发展的第一个阶段大约在20世纪60年代初到70年代中期。在这一阶段,人们认为逻辑推理能力是机器具有智能的重要成分,甚至一度认为推理就是智能。这一阶段的代表性工作主要有A.Newell和H.Simon两位后来的图灵奖得主研发的“逻辑理论家”程序,该程序在1952年证明了著名数学家罗素和怀特海的名著《数学原理》中的38条定理,并在此11年后证明了全部的52条定理,而且定理2.85甚至比罗素和怀特海的证明更加巧妙,令人惊叹。因此,这一时期可以称为“推理期”。

       随着研究的推进,人们逐渐认识到,单靠逻辑推理能力远不足以实现人工智能,以E.A. Feigenbaum为代表的学者认为,知识是有智能的机器所必备的,于是在他们的倡导下,在20世纪70年代中后期,人工智能进入了“知识期”,E.A.Feigenbaum后来被称为“知识工程”之父。在人工智能“知识期”,大量专家系统问世,在很多领域做出了巨大贡献。但这些系统中的知识,大多是人们总结出来并手工输入计算机的,机器能进行多少推断完全由人工输入了多少知识决定,也因此有这么一句对人工智能的调侃:“有多少人工就有多少智能”。之后,人们意识到专家系统面临“知识工程瓶颈”,寻找专家来输入大量知识一方面成本极高,另一方面,对一个特定领域建立的系统无法用在其他领域中,缺乏通用性。于是,一些学者尝试让机器自己来通过学习得到知识,而不依赖于人工输入,这就是人工智能现在所处的“学习期”——从数据中学习到有价值的知识。

       人工智能从“推理期”到“学习期”,走的并不是康庄大道,而是崎岖山路。在“推理期”的高峰,一些进展让人们对人工智能过于乐观,产生了不切实际的想法。A.Newell和H. Simon曾在1958年预言,1968年前计算机将成为世界象棋冠军(实际是1997年,将近30年后)。

       对人工智能的过于乐观导致了人们过高的期望,而当时的人工智能只能解决“玩具”问题,难以在现实问题中发挥作用,一时间,预言失败、承诺无法实现、期望破灭,人工智能遭遇了误解和冷遇,研究经费也被大量削减甚至取消,人工智能进入被称为“AI Winter”的人工智能之冬。

       进入“知识期”后,从1980年代开始,由于专家系统得到应用,人工智能才再次受到关注。这一时期,日本开始巨额投资“第五代计算机”计划,英国、美国也启动了相应的投资项目,人工智能被推进了第二次繁荣。然而在1980年代末,“知识期”人工智能技术局限日益突出,专家系统维护困难、弱点不断暴露,日本五代机计划破产,人工智能第二次进入冬天。

       直到1990年代中期,进入“学习期”的人工智能开始从数据中学习知识,通用的学习方法在许多商业应用中显示出无可替代的价值,人工智能再度掀起浪潮。此时,我们正处于人工智能“学习期”的浪潮之巅。

       为什么是AlphaGo

       棋类游戏通常被认为是人类智慧的浓缩,常常被用于开发儿童智力,因此,对于追求智力的人工智能,棋类游戏一直被作为检验其智能程度的试金石。

       早在1951年,研究者们就设计了西洋跳棋程序。1997年,IBM“深蓝”击败国际象棋世界冠军,举世瞩目。而在“完全信息”棋类游戏(即没有隐藏信息,例如扑克、麻将不属于此类)中,围棋是最难的,也是之前唯一没有被机器攻破的。甚至在一年前,还没有任何围棋程序能够达到职业棋手水平。因此,AlphaGo战胜曾获得世界冠军的人类九段围棋高手,在人工智能历史上记下了重重一笔。

       下棋的本质是搜索,通过交替思考自己和对方可能的走法,找到最有利于自己的落子。AlphaGo的基础框架是“蒙特卡洛树搜索”,是一种聪明的搜索算法,但即使该算法已经聪明地避免了很多无效搜索,也只能达到业余五段、六段的水平。AlphaGo还引入了“机器学习”,通过学习人类历史上高手对弈的棋局数据,对人类的走法进行模拟:记住人类看到一盘棋是如何走下一步的,当碰到没有见过的棋局时,则参考以往相似的棋局,但它完全不懂得人为何要下这一步。进一步,AlphaGo通过“强化学习”,即自己与自己下棋来提高自己。许多人惊讶于这种类似于“左右手互博”的学习机制,但这早在20年前就有。实际上,只要使用“强化学习”来训练对弈游戏,都是“左右手互博”。最终学习得到的模型,被用在“蒙特卡洛树搜索”中,来为一盘棋的好坏做出较为精确的评估,指导避免更多的无效搜索,从而能够在短时间内看得更远、看得更准,找到更好的走法。

       AlphaGo涉及的所有算法部件都是现成的,其“蒙特卡洛树搜索”已经发展了十年,其学习模型CNN成形于上世纪,被大量使用在图像识别也有多年,强化学习也是经历了数十年的发展,大量应用在机器人控制等领域。这些技术的结合在近年也成为研究热点。AlphaGo的贡献在于使用卓越的工程水平,实现了这些技术的结合,用上千CPU和上百显卡进行加速计算,最终取得了与人匹敌的围棋能力。
       我们一方面肯定AlphaGo展现的实力,一方面还要注意到,其中涉及的人工智能技术,都是许多年基础研究的成果,并不是突然就从平地冒出来的。未来人工智能的发展也会如此,今天有哪些积累,未来才会有哪些突破。

       人工智能的下一步

       人工智能已经进入人们的生活,正试图让生活变得更美好。例如,美国DARPA支持的CALO研究计划所产生的一个成果——SIRI个人助理,已绑定在苹果的手机等产品中,能支持用户在简单的任务上使用自然语言与系统进行交互;微软也推出了Cortana智能助理用于Windows产品; 微软翻译工具内置到了通讯软件Skype中,可以在Skype聊天时实时翻译汉、英、法、德、意、西、葡等7种语言;自动驾驶汽车也在蓬勃发展。可以预见,人工智能将成为越来越有力的工具,更好地服务人类。

       然而目前,人工智能技术的瓶颈仍有很多。例如,在人工智能顶级国际会议AAAI’16大会上,国际人工智能协会主席T. G. Dietterich发表主席报告,针对目前人工智能技术缺乏稳健性(例如AlphaGo对战李世石第四局时下出多步臭棋),指出了“稳健人工智能”的发展方向。

       在社会环境方面,人工智能最近可能要面临更大的瓶颈是,由“人工智能科幻”而导致的“人工智能威胁”论不断出现。事实上,正如Facebook人工智能实验室负责人LeCun最近所说,“有些人是因为对人工智能的原理不理解导致恐惧,有些人是为了个人名望宣扬人工智能威胁论,而有些人是为了商业的利益推动人工智能威胁论”。

       另一方面,人工智能发展历史上经历了多次繁荣和低谷的交替。在每一次人工智能的繁荣期,人们往往在取得一些进步后就对人工智能技术的发展盲目乐观,逐渐产生了不切实际的预期和承诺,最终带来的沮丧是导致人工智能进入低谷的直接原因。对于人工智能未来的发展,抱以信心的同时还需冷静对待,防止过大的起伏造成的不利影响。

       (作者系南京大学计算科学与技术系副教授,主要研究方向为人工智能、机器学习等)

责任人编辑:沈王一、谢磊

  • 标签: