无论输赢,2016年的3月都将被镌刻进人类的历史。3月8日-15日,谷歌研发的围棋的人工智能AlphaGO将与十年传奇棋手李世石九段进行五番棋较量。
而Facebook也在开发相应的围棋人工智能,实际上,这些研发都属于人工智能的一部分,旨在让机器通过模仿人类大脑的思维方式来实现比现代计算机更高水平的统计和分析能力。与此同时,3月7日,来自中国的人工智能团队异构智能也宣布将研发异构神机,向世界围棋冠军柯洁九段发出挑战。而在3月6日的农心杯上,柯洁九段战胜了李世石九段。
从象棋到围棋
自1997年IBM超级计算机“更深的蓝”击败世界冠军卡斯帕罗夫以后,人工智能程序开始不断的向人类博弈游戏的最后的堡垒围棋发起了挑战。
虽然此前也有人工智能程序战胜过一些业余围棋选手,但面对职业选手时,仍旧一败涂地。这是因为,国际象棋平均每回合有35种选择,而围棋每个回合则有250种可能,这250种可能中每一种又有250种可能。
而从对战的策略上看,国际象棋的目的就是杀王,子是越下越少;围棋的目的是圈地,子越下越多,地多者胜。而且,围棋还有手筋、劫争、弃子等战术战略层面的技法。国际象棋史上第二位世界棋王伊曼纽尔·拉斯克在评论国际象棋和围棋时,说过:“国际象棋是一种仅仅局限于这个世界的游戏,围棋则有些不像是从地球上诞生的。如果有那么一天,我们发现有一种天外文明和我们玩同一种游戏,那一定是围棋,决不会有任何疑问。”
国际象棋的步数完全可以靠计算出来,而围棋除了计算能力,还与个人的思考方式有关。也就是说,与国际象棋人工智能相比,围棋人工智能更像是一个“人”。围棋被认为是人类发明的最复杂也是最美的游戏。
谷歌的Deep Mind团队给AlphaGO输入了海量的职业棋手的对局,而其自我学习演绎的对局数更是达到了3000万局。Alpha GO的研发人戴密斯·哈萨比斯说:“Alpha GO和IBM的‘深蓝’不同,有自主学习的能力,Alpha GO将来可以适用于医疗等服务领域。”
围棋AI的杀手锏是策略选择和学习能力
人工智能专家吴韧称,所有的围棋人工智能都使用到了蒙特卡洛树搜索(MCTS),它使用蒙特卡洛算法的模拟结果来估算一个搜索树中每一个状态(state)的值。随着进行了越来越多的模拟,搜索树会变得越来越庞大,而相关的值也会变得越来越精确。通过选取值更高的子树,用于选择行动的策略概率在搜索的过程中会一直随着时间而有所改进。目前最强大的围棋程序都是基于蒙特卡洛树搜索的,通过配置经训练后用于预测人类棋手行动的策略概率进行增强。这些策略概率用于将搜索范围缩小到一组概率很高的行动、以及在模拟中抽样行动。