“AlphaGo采用的是蒙特卡罗树搜索框架,加上深度学习和深度强化学习。在这样一个框架下,深度学习尤其是深度强化学习在计算机围棋上的天花板究竟有多高,还是个未知数。”中国人工智能学会副理事长、清华大学计算机系教授马少平指出。
就仿佛科幻小说《三体》中,人类舰队首次迎战三体舰队“水滴”——去年3月,AlphaGo与李世石的围棋对决,让原本自信的人类,被不可预料的强大战斗力打了个措手不及。而与《三体》中人类舰队几乎全军覆没、残存舰队仓皇逃走所不同的是,李世石版人机大战还留下了一个悬念:人类围棋第一人柯洁,与AlphaGo战果如何?
如今,这个悬念将在今年5月于乌镇揭晓。
4月10日,中国围棋协会、浙江省体育局及谷歌共同宣布,三方将于5月23日至27日联合主办“中国乌镇·围棋峰会”(以下简称“围棋峰会”)。围棋峰会首日,柯洁与AlphaGo升级版的比赛将正式开打。该次比赛将采用中国规则的三番棋赛制,无论输赢均下满3盘,比赛每方3小时,5次1分钟读秒。
除此之外,主办方表示,围棋峰会期间还将举办配对赛和团队赛。在配对赛中,两位棋手将分别与AlphaGo组队,以此挑战棋手如何理解AlphaGo的独特风格并与之合作;在团队赛中,将由五位中国顶尖棋手合作,建立棋手“神经网络”与AlphaGo对决。
“我在半年前得知了与AlphaGo对决的消息,这次能够与AlphaGo对决,是我的荣幸。”在10日发布会现场,柯洁如是坦言。而对于一个“只有胜利才是唯一真谛”的棋手而言,柯洁表示“这一次不会轻易妥协”,并称“抱有必胜的心态和必死的信念”。
来自未来的对手
本次发布会就如AlphaGo一般神秘。在发布会前夕,谷歌仅对外通知10日下午将有“重磅消息”,直到10日上午9点之前,发布会地点仍是一个谜团。
即便如此神秘,也难掩内容本身的耀眼。早在数日之前,发布会的内容便不胫而走:业内传闻AlphaGo将与柯洁有一战,战期定档在5月下旬的乌镇。在10日发布会现场,主办方宣布这个巅峰对决的时间为5月23日。
赛事如此吸引眼球,原因在于这次的交战双方。
作为当今棋坛第一人,柯洁更像是人类获胜的最后一丝希望。他曾在一年前李世石0:2落后于AlphaGo之际放出豪言:AlphaGo要证明自己天下无敌,必须先过自己这一关,并称自己有信心战胜对手,“胜算大概在六七成”。
如今,在围棋峰会发布会现场,柯洁则显得更为谦虚,将AlphaGo描述为来自未来的对手。“现在的AlphaGo已经超过我们最强棋手的想象,带给我们最大的震撼与享受,”柯洁感慨道,“我是站在了历史变革的节点之上,很幸运能够见证AlphaGo这样强大的棋手。”
作为人工智能代表,全新版本AlphaGo相较一年之前更加强大,这也成为本次赛事的另一大看点。据介绍,新版AlphaGo采用了新的
机器学习技术,能够通过训练形成策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成概率分布,然后训练出价值网络进行预测,以对手的绝对胜利到AlphaGo的绝对胜利为标准,预测所有可行落子位置的结果。
而AlphaGo的真正优势体现在,将策略网络和价值网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,将监督学习和强化学习结合起来。此外,新版AlphaGo还将产生大量自我对弈棋局,通过自身为下一版本提供训练数据。
“蒙特卡罗树搜索的算法是让AlphaGo不停地自我对弈,”一位业内观察人士表示,“通过自我对弈,进而训练价值网络和策略网络,从而优化蒙特卡罗树搜索。”
换言之,击败李世石的AlphaGo 1.0,是通过学习大量人类对战棋谱及与多位人类顶级高手交锋,不断积累形成棋力的。本次迎战的AlphaGo 2.0版本,则将完全摒弃人类棋谱,凭借自我对弈成长为顶级高手。
不过,尽管柯洁自己坦言AlphaGo为强劲对手,却仍表示不会轻易妥协。“无论它多么强大,我都要一决胜负,并尽力击败AlphaGo,”柯洁称,“现在我的心情很激动,期待五月的大战。”
胜负之外
尽管还未开战,但外界对本次赛事的结果,已经开始有了预期。
“AlphaGo采用的是蒙特卡罗树搜索框架,加上深度学习和深度强化学习。在这样一个框架下,深度学习尤其是深度强化学习在计算机围棋上的天花板究竟有多高,还是个未知数。”中国人工智能学会副理事长、清华大学计算机系教授马少平指出。
而就是这样尚看不清天花板的人工智能
应用 ,已经足以横扫人类顶级高手。一年以来,由AlphaGo引爆的各色棋牌类人机大战的结果已基本没有任何悬念:无论是AlphaGo化身Master,在网上实现对阵各国高手,实现60连胜(其中亦包括柯洁),还是腾讯绝艺在腾讯野狐平台率先晋升网络十段,此后在第10届UEC杯中称王,或是新近落幕的德州扑克人机对决中,卡内基梅隆大学开发的“冷扑大师AI”毫无悬念地战胜中国龙之队……在棋牌类人机大战中,人类已越来越心平气和地接受了自己的落败。
“AlphaGo与人类的对决已持续了很长时间, 机器人 确实很强大。比赛的胜负很重要,柯洁也表示将竭尽全力比赛并争取胜利,”围绕此次对决,国家体育总局棋牌运动管理中心主任罗超毅指出,“柯洁没有与AlphaGo进行慢棋比赛,现在谁输谁赢还没有落定。”
事实上,在年初Master的网络对局中,它采用的都是“20秒3次”的超快棋方式,几乎都是在中盘轻易取胜,然而在去年李世石对阵AlphaGo时采用的是慢棋,最终有一盘取胜。而在本次围棋峰会中,无论是柯洁与AlphaGo的“单挑”,还是顶级棋手组成“神经网络”与AlphaGo“车轮战”,都延长了行棋的时间,无形中对人类或将更加有利。
此外,罗超毅强调,胜负固然重要,却并非本次围棋峰会的全部,也不是峰会的主题。“柯洁与AlphaGo的对决,不仅仅是人机对战,而是科学家与棋手的智慧交流。”罗超毅指出,“柯洁曾提到,AlphaGo的许多招法是过去所没有想过的,这也恰好证明了围棋奇妙无穷,提升的空间很大,无论棋手还是深度学习团队,都将从中获益匪浅。”