Abbeel 的实验室的研究人员对这项突破感到着迷,他们决定用自己写的类似强化学习 算法 来做实验,试图帮助 机器人 学习游泳、学习单脚跳以及走路。或者玩视频游戏怎样?令他们惊讶的是,这个所谓的 TRPO(Trust Region Policy Optimization,信任区域策略优化) 算法 实现的结果几乎跟 DeepMind 的 算法 一样好。换句话说,TRPO 展现出了用一般方法学习的能力。“我们发现 TRPO 不仅可以教 机器人 走路,” Abbeel 说:“还可以在视频游戏中击败人类。”
Abbeel 调出了一个有关一个 机器人 模拟器的视频。视频开头可以看到一个 机器人 摔倒在黑白相间的地板上。“记住,这个 算法 跟学视频游戏的是一样的,” 他说。 机器人 被布置了 3 个目标:有多远走多远,不要踩到自己的脚,以及躯干要高于一定高度。“它不知道走路是什么意思,” Abbeel 说:“也不知道自己有手有脚。它只知道自己的目标。然后想办法实现目标。”
Abbeel 按下一个按钮,模拟开始工作。 机器人 笨重地摔到地上,不知道自己在干什么。“原则上,它应该能确定自己要走还是跳,” Abbeel 说。但是 算法 是通过实时 “了解” 到只要把自己的腿抬起来,它就能推动自己向前走来确定的。这让 机器人 可以分析自己上一次的表现,解码出哪一种动作的表现更好,然后在未来相应改变行为。很快 机器人 就开始蹒跚而行,东倒西歪像喝醉酒一样。它会突然往前扑倒,爬起来,走了几步,然后又倒了。但是慢慢地它的表现开始提高,学会了跌跌撞撞地朝着目标跑过去了。你几乎能感觉到它的信心在增加,抬腿的速度快得就像一名跑锋(running back)一样。 机器人 不知道自己在跑,因为程序没有进行设置。但现在它已经在跑了。它自己自己学会了复杂的平衡和肢体控制这些物理学的知识。这已经不仅仅是令人吃惊了,简直就是魔术。就好像是在短短 40 秒的时间内目睹一条鱼变成了人一样。
“ 机器人 移动和开始走路的方式让它看起来就像是活的一样,” 我说。
Abbeel 笑了:“差不多吧。”
尽管书本和电影里面有 人工智能 的各种渲染,但这个东西可不是悬浮在某处蓝色液体箱的一个合成大脑。 人工智能 是 算法 —一个数学方程式,它告诉计算机执行什么功能(通俗点你可以把它理解为机器的食谱;更深入的话题可参见寻找生命的基础 算法 )。21 世纪的 算法 就像是 19 世纪的煤矿:是我们的经济引擎,是现代生活的燃料。没有 算法 ,你的电话无法工作,也不会有 Facebook、Google、Amazon。 算法 规划航班然后引导飞机飞行, 算法 帮医生诊断疾玻“如果每个 算法 突然停止工作,我们所熟知的世界就要终结,” 机器学习 的流行读物《主 算法 》的作者 Pedro Domingos(参见有没有主宰世界的主 算法 )写道。在 AI 的世界里,圣杯就是发现能够让机器理解世界的那个 算法 ,这就好比是能够让物理学家解释宇宙运作机制的标准模型,只不过前者是数字世界的。
数学 算法 已经有几千年的历史,是现代计算的基矗输入数据,计算机处理,然后 算法 吐出结果。但是现在科学家已经开发出能够逆转这个过程的 算法 ,也就是让计算机写自己的 算法 。比方说你想让直升机倒着飞:你会写个 算法 告诉计算机有关直升机控制方面(输入数据)的信息,然后你告诉它你想让直升机怎么飞,飞行角度如何(结果),Bingo!计算机就会倒腾出自己的 算法 ,然后告诉直升机怎么做。这个过程就叫 机器学习 ,它是 AI 想法的核心:如果机器能够教自己让直升机倒着飞的话,那它也应该会自学其他事情,比如如何在 Tinder 上找到爱人,或者在你对着 iPhone 说话时认出你的声音,或者将来设计出一个创造终结者的天网出来。DeepMind 联合创始人 Demis Hassabis 已经说了:“ 人工智能 是让机器变聪明的科学。”
当然,实际上我们已经被智能机器包围了。你在用 Google Maps 的时候, 算法 给你画了一条最快捷的路线,并且根据实时数据计算出交通延误并对交通状况作出预测性分析。当你对着 Google Voice 说话时,它能认出你的声音是基于 神经网络 这种 机器学习 算法 ,它让计算机把你的话变成声音片段,然后跟别的片段进行比较,再理解你的问题。Facebook 通过图像识别程序扫描数十亿图片,将斩首视频、JB 图片等有害内容拒之门外。
智能机器正在加速,可它要去向何方呢?地球的生命从诞生到实现更高智能花了 30 亿年的时间。相比之下,计算机大概只用 60年 就从一大块硅片变成了能够开车穿越美国或者在人群中认出一张脸的机器。每过去一周,就会有新的突破被宣布出来:今年1月,DeepMind 披露自己已经开发出一种 算法 ,这种 算法 击败了欧洲的围棋冠军(该 算法 叫做 AlphaGo,从 3月9号开始,它将与韩国的顶尖围棋选手李世石进行一场 5 番棋大战)。当然,它的快速演进还在人类的掌控当中,但你很难不去想我们是不是已经到达智能机器演进的某个拐点了。我们是不是即将目睹一个新物种的诞生?机器还要多久就会变得比人还要聪明呢?
Google 的未来学家 Ray Kurzweil 提出了后来风行的 “奇点” 论,奇点说的是硅基机器变得比碳基机器(人类)更聪明的时刻,到那个时候,进化的天平将会向前者倾斜。“未来我们会对云展开大量思考,” 他在几年前的一场技术会议上如此说道。他甚至还预测了奇点到来的确切时间:2045年。在最近一场会议上的即席发言时,Tesla 和 SpaceX 的创始人 Elon Musk 把 AI 的发展称为是 “对恶魔的召唤”。尽管随后他告诉我说自己的说法有点过头,但他又说:“智能机器的崛起向我们提出了一个严重的问题,即我们需要考虑,作为人类我们是谁?我们希望建设一个怎样的未来?” 正如他指出那样,我们现在已经严重依赖机器了:“我们已经是赛博格(cyborg)了。不信你把手机关了看看—你就会知道幻肢综合症是什么样子的。”
这并不是说超智机器要变得超级邪恶才会构成威胁。“AI 的真正风险不在于它的恶意,而在于它的能力,” 物理学家霍金最近指出:“超智 AI 极其擅长实现自己的目标,如果它的目标跟我们的不一致的话,我们就有麻烦了。你可能并不是邪恶的蚂蚁仇恨者,不会出于恶意踩死蚂蚁,但如果由你来负责一个水电绿色能源项目,然后需要淹没一个蚁窝所在的区域时,对于蚂蚁来说情况就太糟糕了。我们不要让人类落到那些蚂蚁的境地。”