由
人工智能研发团队DeepMind发表的AlphaZero登上最新一期《科学》杂志封面。这已经不是DeepMind第一次登上国外权威杂志的封面,每一次DeepMind被报导都会获得人工智能学界的一阵欢呼,这次更是如此。同时击败围棋、将棋、国际象棋最强AI的AlphaZero,被认为可能代表着深度学习AI的终极解答。
《科学》杂志表示,如果人们想透过一套计算方式去解决多个不同的复杂问题,那么唯一能够达成这目标的办法就是,创造一个自主学习的人工智能系统,让它自行学着去解决问题。而AlphaZero办到了。
根据DeepMind的介绍,AlphaZero使用完全无需人工特征、无需任何人类棋谱、甚至无需任何特定最佳化的通用强化学习算法。举例来说,由于围棋的规则明显和其他棋类如国际象棋、将棋不同,像是围棋的每一子都是完全相同的、且棋盘也是完全对称的。
为了因应围棋的特殊性,AlphaZero的前身AlphaGo Zero便有设计专为围棋使用的特殊计算程序。但AlphaZero没有,作为一个“通用型”学习AI,AlphaZero完全仅依靠深度神经网络和蒙特卡洛搜索树算法的自我学习。在完全没有输入人类的棋谱、没有输入特别设计的专用计算程序的情况下,只借着自我对弈的不断学习,AlphaZero就已经能够分别在围棋将棋国际象棋击败了原本的世界最强AI。
而且,AlphaZero打败原本的国际象棋世界最强AI只花了4小时学习,打败原本的将棋世界最强AI只花了2小时学习。打败原本的围棋世界最强AI只花了30小时学习。AlphaZero最大的特色就是可以学会并精通不同的棋类竞赛,而且它每一步棋所须计算的可能性变化,比之前的AI要来得少许多。换句话说,AlphaZero并不是去无限量的计算棋盘所有可能性,而是透过自己的深度神经网络研判,专注于小范围的计算。
这样的“思考模式”,其实正和一般人类棋士无异。国际象棋前世界冠军Garry Kasparov就表示,AlphaZero的下棋风格灵活多变,“和我很像!”,且不同于其他AI程序倾向保守的先求立于不败,AlphaZero非常具有侵略性,更喜欢冒险。传统的人工智能程序在下棋时,凭借强大计算能力很少犯错,但在面对不清楚“该计算什么”的局面时,便容易出现失误。反观AlphaZero,它呈现出的是一种“感觉”、“洞察”,一种对棋盘上局势发展的直觉。
曾和AlphaGo Zero对奕的围棋棋士李世石便说过“我改变了看法,AlphaGo Zero不只是机器,它具有创造性”。而现在同时精通围棋将棋国际象棋的AlphaZero,显然拥有更强更灵活的创造能力。
过往的人工智能程序,往往只能精通专一领域,只能处理特定情境的问题。但AlphaZero不同,它能够适应各种规则。这让人相信,未来可以将这深度自主学习的AI能力,运用在其他问题上。比如说,DeepMind团队开发的最新家族成员AlphaFord,便是投入在学习基因序列的蛋白质结构相关问题。假如在此领域AlphaFord也能获得惊人成就,那可不同于在棋类竞赛赢过对手,将会真正替人类社会带来巨大改变。
下一次登上封面的会否就是AlphaFord?深度学习的人工智能究竟能发展到何种里程碑,让我们一起期待吧。