爱吧机器人网 » 专题 > 观点 > 正文

AI和深度学习如何给游戏带来生命?

想了解更多的使用深度学习来开发数字化体验的内容,请查看Danny Lange在2017年9月17-20日人工智能旧金山大会上的议题《使用深度学习给游戏、VR和AR带来生命》。

游戏开发是一个复杂且劳动密集型的工作。游戏的环境、故事线和人物个性都需要被仔细地构建。这需要视觉艺术家、编故事的人和软件工程师一起密切协作才能完成。通常,在传统编程的形式下,游戏会有一套专门编写的行为;或是在有大量规则组合的形式下,会以更加有反馈的行为来构成。在过去的几年间,数据密集的机器学习解决方案已经在企业(比如Amazon、Netflix和Uber)里消灭掉了基于规则的系统。在Unity,我们已经在探索使用这样的一些机器学习的技术,比如用深度学习做内容构建,用深度增强学习来进行游戏开发。我们已经看到这一波的机器学习和人工智能在游戏领域的巨大潜力。

对于一些数据驱动的大型企业而言,机器学习并不是什么新东西。2007年,当Netflix发起了著名的Netflix Prize竞赛,让最好的协同过滤算法来预测用户对 电影 的评分时,就是我们现在所体验的对人工智能的大量媒体报道的开端。但是在2000年初,一些大企业就已经在尝试使用数据驱动的决策和机器学习来提升业务了。Amazon已经非常努力地开发他们自己的推荐算法,尝试去发现用户的偏好,进而把这些偏好转化成更高的销售业绩。广告业的技术则是另外一种早期采用机器学习者,机器学习被用来提升点击率(CTR)。在过去的这些年里,机器学习技术已经成熟并扩散到非常多的行业。

例如,推荐算法已经从仅仅通过推荐来探求更多的信息发展到了探索和搜索的组合。这里的挑战是,当Amazon和Netflix使用推荐系统来收集数据时,如果他们仅仅是给用户推荐高得分的物品,而不是他们商品目录里的其他物品,他们获得的是一个不完整的用户偏好。这一问题的解决方案是微妙地从纯搜索变化到添加一些因素来探索。

最近,因为它们内在的可以探索和搜索的特性,诸如上下文老虎机这样的算法变的流行起来。这些算法可以更好地学习到它们还不了解的客户的东西。相信我,在你访问的很多Amazon网页的背后都潜伏着老虎机算法。我们在Unity的博客上有一篇不错的文章介绍上下文老虎机算法的威力。里面有一个对上下文老虎机算法的交互展示。

在2015年初,DeepMind将上下文老虎机算法进一步发展,并发表了一篇论文。其中介绍了一个把深度神经网络和增强学习组合起来的大规模系统。这个系统可以精通Atari的2600个游戏里的很多个,还仅仅只是依靠原始像素和得分作为输入就能取得超越人类的水平。DeepMind的家伙把探索和搜索的概念变成了兴奋剂。虽然上下文老虎机在学习行为上还比较得浅,但深度增强学习则能够学习一系列的行为用以最大化未来的累积收益。换句话说就是,它们可以学习优化长期价值(LTV)的行为。在一些Atari的游戏里,LTV通常是只有人类玩家掌握的一些策略发展。看这里的一个Breakout游戏的视屏来了解这种策略发展的例子。

在Unity,我们问自己如何才能让一只小鸡学会穿过一条交通繁忙的道路而不被来往的卡车撞死,同时还能收集礼物包。我们用了一个通用的和DeepMind的试验类似的增强学习算法。它会给小鸡一个正分如果它收集了一个礼物包,一个负分如果它被卡车撞死。另外,我们给小鸡四种可能的行动:向前、后、左、右移动。仅仅使用图像的像素和得分作为输入,以及这些非常简单的移动指示,在6个小时的训练后,小鸡就获得了超越人类的水平。可以在这里看相关的 视频 :

我们具体是怎么实现这一切的?实际上很简单。一套Python的API让我们可以把Unity的游戏与运行在Amazon云服务(Amazon Web Services,AWS)上的TensorFlow的服务连接起来。TensorFlow是Google在2015年发布的一个深度学习的框架。如你在这个 视频 里看到的,在训练的早期阶段,小鸡主要是在进行探索。但随着学习的深入,它逐渐地转变到搜索了。可以看到这一学习系统的一个重要能力就是它能成功地应对“没见过的”情形。卡车出现和礼物包的位置的组合是完全随机的。当小鸡被训练了几个小时候后,统计意义上它还是会持续地的碰到没有见过的场景。我们的Python API能很容易地从游戏里读取游戏框架和内部状态,并使用机器学习模型来反向控制游戏里的代理(比如小鸡)。

现在让我们对小鸡和它超人的能力做一个反思。小鸡游戏自身只是提醒了我们Amazon、Netflix和Uber是如何使用相同的技术来更好地服务他们的客户(不管是Uber的无缝载客体验或是Netflix给我展示按照我的口味定制的内容),不过它的确打开了在游戏开发中使用训练而不是硬编码的大门。

设想一下在游戏里训练一个非玩家角色(NPC, non-player character),而不是去编码它的行为。游戏开发人员需要做的会涉及到创建一个NPC需要被训练的游戏场景,他们会使用前面提到的Python API连接云端的增强学习的环境来进行这个训练。这个场景可以是完全人工设计的,或者是有NPC要去学习的一群人类玩家参与的。当NPC的表现令人满意后,另外一套Unity的API会允许开发人员直接把TensorFlow的模型嵌入到他们的游戏里面去,从而消除了需要继续把游戏连接到云端的TensorFlow服务的需求。

一些游戏开发人员可能会说他们在10到15年前最后尝试机器学习时“就已经这样做了”。但那是一个不一样的时代。那时候,通过富于表达的循环神经网络(RNN)——比如长短期记忆(LSTM)——来学习序列数据,以及通过卷积神经网络(CNN)来学习空间特征等技术都已经被发明出来了。但缺乏计算能力以及缺乏可扩展和精细的软件框架阻止了这些技术在实际中的成功 应用 ,以及在诸如游戏开发这样有需求的行业里被采用。

在游戏开发里使用深度增强学习依然处于它的早期阶段。但对我们而言一切正在变得很清晰:类似于在其他大型企业里被证明的一样,这是一个潜在的颠覆性游戏技术。诸如TensorFlow这样成熟的、可扩展的、运行在云端并有集成的API接口的机器学习框架正在降低游戏开发人员和机器学习研究人员进入这个领域的门槛。正如机器学习正在进入企业的每个角落一样,你应该也会期待在你的下一个游戏里面机器学习会无处不在。

This article originally appeared in English: "Bringing gaming to life with AI and deep learning".


上一篇:手机AI是蓝海也是血海
下一篇:AI助力机器人执掌全球?科学家称人类将陷入绝境
精选推荐
什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

本周栏目热点

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

[1970-01-01]    从首尔清潭洞SM娱乐公司大楼代表办公室的落地窗可以清晰地眺望对面的汉江。李秀满会长介绍拥有代表办公室和录音室的建筑物是工作室中心 ...

[1970-01-01]    虽然我国经济增速下降,通缩若隐若现,但由于我国劳动力人口在2012年已经达到顶峰,之后总量呈逐年下降之势,所以即使近几年产业工人工 ...

腾讯思享会:探讨智能社会与人类未来

[1970-01-01]    人类在享受开车的过程时,在不久的将来可能让机器开车,人类如不是理性的控制机器人,又将一场持久的大战。  以智能社会与人类未来为 ...

[1970-01-01]    机器人发展到今天到了重新定义的时候,机器人拥有人类的感知和思维、应用到更多领域,成为现代机器人产业发展的新方向,由此看出中国机 ...