用中文传话游戏理解RNN-神经网络-技术-爱吧机器人网

用中文传话游戏理解RNN

2018-05-31 AI研习社浏览量：

本文为雷锋字幕组编译的技术博客，原文名 Understanding RNNs using the game of Chinese whispers ，作者 Eniola Alese。翻译 | 陈涛整理 | 吴璇

循环神经网络（RNN）是人工神经网络中非常流行的一个版本，其可以很好地处理序列数据类型。该数据类型指的是将一组数据点以特定顺序排列，从而使相关的数据点一个挨着一个，具体的例子有：股票市场价格、音频和视频数据、DNA 序列、传感器数据、自然语言文本等等。

为了直观地了解 RNN 是如何工作的，假设我们正在玩一个很受欢迎的儿童游戏——中文传话。该游戏的目的是最后一个人能准确预测出句子中所漏掉的词语，比如「The brown dog has four _____」。

中文传话游戏

玩家们需要排成一队，并且根据句子中词语的排列，每个人都会得到其中的一个词语，比如玩家 1 得到词语「the」，玩家 2 得到词语「brown」，玩家 3 得到词语「dog」，以此类推。首先，队伍中的第一个人把他听到的词语悄悄地告诉队伍中站在他身后的玩家。然后这个玩家将这个词语和自己的词语一起悄悄地告诉他身后的人。接下来，整个队伍不断重复这个过程直到最后一个玩家。最后的玩家需要预测出所漏掉的词语，并大声地把这个消息告诉整个集体。

显而易见的是，最后一个玩家可以准确地猜出漏掉的词语是「legs」。这是因为前一个玩家告诉了他这个句子的前面部分：「The brown dog has four」，所以他能够通过该语境推导出这个词语。

上文说明了 RNN 的基本原理。通过提取序列之前的信息，并结合序列当前的输入，该网络能够预测出序列的下一个输出。

RNN的展开由上文可知，RNN 能够通过对整个序列重复同样的过程，从而做出预测。左下图显示了循环网络的基本结构。它同时接收序列数据输入向量（x）和隐藏状态信息（a），然后使用二者去预测序列数据的输出。

为了正确地将系统工作方式可视化，我们通常把 RNN 展开成与序列数据长度一致的一连串重复的单元或称之为时间步（如右上图所示）。比如我们需要处理的序列是一个有三个词语的句子时，那么其将被展开成有三个时间步的 RNN 网络，每一个时间步处理一个词语。

RNN 的设计架构序列数据的输入和输出有各种各样的形式和长度。比如在情感分析任务中，输入通常是一串文本，而期望的输出是一个整数（1-5 的评分范围）或是单个文本（好的、坏的，积极的、消极的、中性的）。然而在语音文本任务中，输入则是声波中的一串声音信号，其输出则是一串对应的文本。

正是由于这些差异，当需要处理序列任务时，我们会针对性地设计 RNN 的输入和输出结构。一些常见的架构类型如下：

1. 多对多架构（同样的序列长度）

这是最基本的 RNN 结构，在每个时间步中输入序列的数量与输出序列的数量是一致的。一个使用该架构的应用实例是文本生成器：根据句子中前面的词语，预测下一个最有可能的词语。

采用多对多 RNN 架构的文本生成器

如上图所示，文本生成器的输入是一串词语，输出则是由预测得到的下一个词所组成的一串词语：「brown dog has four legs」。

2. 多对多架构（不同序列长度）

当需要处理输入和输出序列的数量不一致时，我们便可采用多对多架构的另一种版本。而机器翻译任务就是这样的一个应用实例：输入是原文的一串词语（比如法文），而输出是译文的一串词语（比如英文）。这个架构有两个不同的模块：编码器和解码器。前者接受输入的句子，将其映射成内部状态表征，然后将其传给后者，以供其生成输出的句子。

采用多对多 RNN 架构的机器翻译

在此架构中，当编码器将全部的输入序列处理完后，解码器才开始对输出的序列进行预测。这与前面提到的相同序列长度架构完全不同，在那个架构中，其每收到一个输入序列对象后，马上开始对每一个输出序列对象进行预测。

3. 多对一架构

在此架构中，RNN 在每个时间步都有一串输入，但只有在最后一个时间步输出一个单一值。情感分析任务正是此情景下的应用实例：任务的目的是对输入的语句进行分类，判断其是否有正面或负面的情感。

采用多对一 RNN 架构的情感分析任务

在上图的情感分析任务中，RNN 并不是在每个时间步都有输出，而是在读完整串词语后，仅在最后一个时间步输出一个单一值：「positive」。

4. 一对多架构

此处的 RNN 在第一个时间步接受一个单一值，然后在剩余的时间步中输出一串值。基于此架构的应用通常会取得每个时间步的预测输出，并把它传递给下一层，作为该层的输入值。一个应用实例是图像标注：RNN 接受一幅图像作为输入，然后输出描述图像中所发生事情的一串词语。

采用一对多架构的图像标注

上图显示了输入是一个女性跑步的表情符号，而输出则是预测得到的一串词语：「woman in blue vest running」。

结论

在这篇文章中，我们简单介绍了循环网络以及其不同类型的架构，包括相应的应用实例。

来源
https://medium.com/learn-love-ai/introduction-to-recurrent-neural-networks-rnns-43238d037a5c

精选推荐

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

[2019-10-26] 谷歌刚刚宣布，其搜索引擎的核心算法正在进行一项重大升级，这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术（BERT ...

比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03] 软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用，而不会杀死他们，并拿起像西红柿这样柔软的物体。” 从长远来看，布鲁塞尔大学队伍正在努力创建一个类似的材......

英国首台月球车是个小型四腿机器人将于2021年登月

[2019-10-12] 探测器将用四条腿探测月球表面，并将数据传回着陆器，后者将把数据传回地球图詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17] 电阻RAM技术开发商Crossbar表示，它已与航空航天芯片制造商Microsemi达成协议，允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

MIT最新“人机”互连系统让双腿机器人复制人体技能

[2019-11-01] MIT的小爱马仕想借用你的大脑，图片来自: João Ramos爱吧机器人网消息，麻省理工学院（MIT）的研究人员展示了一种新型遥操作系 ...

揭秘达芬奇手术机器人

[2018-04-19] 达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局（FDA）于2000年通过该标准，旨在利用微创手段 ...

机器人从工业走向家庭库卡KUKA目标是引领中国市场

[2017-12-08] 机器人正在改变着人们的生活方式，而库卡KUKA想要在中国这个大蛋糕中占有一块大份额，库卡公司正在引领市场...

哈佛大学《自然》发表新驱动技术，让飞行机器人悬停且不受损伤

[2019-11-06] 哈佛大学研究人员发表在《自然》杂志上的一项最新研究，他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂（RoboBee），这种机器人在撞墙、 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

飞桨火力全开，重磅上线3D模型：PointNet++、PointRCNN！

[2020-03-26] 11 年前的「阿凡达」让少年的我们第一次戴上 3D 眼镜，声势浩大的瀑布奔流而下，星罗棋布飘浮在空中的群山，无一不体现着对生命的敬意， ...

神经网络结构在命名实体识别（NER）中的应用

[2018-01-17] 近年来，基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务—命名实体识别（Named Entity Recognition，NER）也不例外，神经网络结......

从基础概念到数学公式，这是一份520页的机器学习笔记（图文并茂）

[2018-06-19] 近日，来自SAP（全球第一大商业软件公司）的梁劲（Jim Liang）公开了自己所写的一份 520 页的学习教程（英文版），详细、明了地介绍了机器学习中的相关概念、数学知识和各......

50行代码玩转生成对抗网络GAN模型！（附源码）

[2018-07-30] 本文为大家介绍了生成对抗网络（Generate Adversarial Network，GAN），以最直白的语言来讲解它，最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06] 爱吧机器人网编者按：近日，《自然-神经科学》发表了一篇论文，研究人员创建了一种深度人工神经网络，能够准确预测生物大脑对视觉刺激所产 ...