深入浅出谷歌人工智能围棋 “大脑”-人工智能-技术-爱吧机器人网

深入浅出谷歌人工智能围棋 “大脑”

2016-02-22 36氪浏览量：

　　增加阅读

　　这里做了三个版本的落子选择大脑，加上局面评估大脑，AlphaGo 可以有效去阅读未来走法和步骤了。阅读跟大多数围棋 AI 一样，通过蒙特卡洛树搜索（MCTS）算法来完成。但 AlphaGo 比其他 AI 都要聪明，能够更加智能的猜测哪个变种去探测，需要多深去探测。

　　蒙特卡洛树搜索算法

　　如果拥有无限的计算能力，MCTS 可以理论上去计算最佳落子通过探索每一局的可能步骤。但未来走法的搜索空间对于围棋来说太大了（大到比我们认知宇宙里的粒子还多），实际上 AI 没有办法探索每一个可能的变种。MCTS 做法比其他 AI 有多好的原因是在识别有利的变种，这样可以跳过一些不利的。

　　Silver 团队让 AlphaGo 装上 MCTS 系统的模块，这种框架让设计者去嵌入不同的功能去评估变种。最后马力全开的 AlphaGo 系统按如下方式使用了所有这些大脑。

　　1. 从当前的棋盘布局，选择哪些下一步的可能性。他们用基础的落子选择器大脑（他们尝试使用更强的版本，但事实上让 AlphaGo 更弱，因为这没有让 MCTS 提供更广阔的选择空间）。它集中在 “明显最好” 的落子而不是阅读很多，而不是再去选择也许对后来有利的下法。

　　2. 对于每一个可能的落子，评估质量有两种方式：要么用棋盘上局面评估器在落子后，要么运行更深入蒙特卡罗模拟器（滚动）去思考未来的落子，使用快速阅读的落子选择器去提高搜索速度。AlphaGo 使用简单参数，“混合相关系数”，将每一个猜测取权重。最大马力的 AlphaGo 使用 50/50 的混合比，使用局面评估器和模拟化滚动去做平衡判断。

　　这篇论文包含一个随着他们使用插件的不同，AlphaGo 的能力变化和上述步骤的模拟。仅使用独立大脑，AlphaGo 跟最好的计算机围棋 AI 差不多强，但当使用这些综合手段，就可能到达职业人类选手水平。

　　AlphaGo 的能力变化与 MCTS 的插件是否使用有关。

　　这篇论文还详细讲了一些工程优化：分布式计算，网络计算机去提升 MCTS 速度，但这些都没有改变基础算法。这些算法部中分精确，部分近似。在特别情况下，AlphaGo 通过更强的计算能力变的更强，但计算单元的提升率随着性能变强而减缓。

　　优势和劣势

　　我认为 AlphaGo 在小规模战术上会非常厉害。它知道通过很多位置和类型找到人类最好的下法，所以不会在给定小范围的战术条件下犯明显错误。

　　但是，AlphaGo 有个弱点在全局判断上。它看到棋盘式通过 5*5 金字塔似的过滤，这样对于集成战术小块变成战略整体上带来麻烦，同样道理，图片分类神经网络往往对包含一个东西和另一个的搞不清。比如说围棋在角落上一个定式造成一个墙或者引征，这会剧烈改变另一个角上的位置估值。

　　就像其他的基于 MCTS 的 AI， AlphaGo 对于需要很深入阅读才能解决的大势判断上，还是麻烦重重的，比如说大龙生死劫。AlphaGo 对一些故意看起来正常的局也会失去判断，天元开盘或者少见的定式，因为很多训练是基于人类的棋局库。

　　我还是很期待看到 AlphaGo 和李世石 9 段的对决！我预测是：如果李使用直（straight）式，就像跟其他职业棋手的对决，他可能会输，但如果他让 AlphaGo 陷入到不熟悉的战略情形下，他可能就赢。

精选推荐

MIT最新“人机”互连系统让双腿机器人复制人体技能

[2019-11-01] MIT的小爱马仕想借用你的大脑，图片来自: João Ramos爱吧机器人网消息，麻省理工学院（MIT）的研究人员展示了一种新型遥操作系 ...

哈佛大学《自然》发表新驱动技术，让飞行机器人悬停且不受损伤

[2019-11-06] 哈佛大学研究人员发表在《自然》杂志上的一项最新研究，他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂（RoboBee），这种机器人在撞墙、 ...

什么是机器人学？机器人学简介

[2017-12-14] 机器人学是工程学与科学的交叉学科，包括机械工程，电气工程，计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用，以及用于控制、感官反馈和信息处理的计算机系统。...

CES 2018：英特尔推出49量子位芯片争夺量子霸权

[2018-01-10] 在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中，英特尔通过了一个关键的里程碑。近日，这个科技巨头已经推出了一个49个量子位 ...

科学家从蟑螂获得启发教机器人更好地走路

[2017-12-11] Weihmann指出：“我特别感到惊讶的是，动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定，因为它的重心很低，三条腿总是以协调的方式运动。...

智能机器人困惑的时候知道该问什么问题

[2017-03-20] 照片：Nick Dentamaro 布朗大学上周，我们提到了麻省理工学院的一些研究，即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

可编辑神经网络，有望简化深度学习？

[2019-10-04] 深度学习是一个计算繁重的过程。降低成本一直是 Data curation 的一大挑战。关于深度学习神经网络大功耗的训练过程，已经有研究人员 ...

受大脑控制的机器人

[2017-03-21] 想让机器人做我们想做的，首先，他得全面地了解我们。通常，这就意味着人类需要要付出更多。比如，教机器人复杂的人类语言或者把一项任务 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

说一说那些进入日常生活的智能机器人

[1970-01-01] 　　从《星球大战》里的机器人英雄，到前些年大受欢迎的电影《我，机器人》，无数的科幻作品里都少不了机器人元素，人们将之视为未来感的 ...

奇点大学：人工智能与“奇点理论”

[1970-01-01] 　　就在前几天和行业内的几个朋友吃饭时，内容在不经意间又转向了那个老生常谈的话题-到底什么是在智能电视上最好的交互方式上，于是乎五 ...

说客小π情感机器人体验【评测】

[2015-12-29] 　　前言　　随着语音识别技术的发展，声控灯、语音输入法、语音交互等各具特色 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01] 　　无论你是否认为面部识别令人毛骨悚然，很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。　　无论是微软的猜年龄机器人， ...

麻省理工智能机器人最新技术机器手指研究获得突破

[2015-12-27] 　　麻省理工智能机器人最新消息，今年在研究机器手方面跨出了一大步，现在它又 ...