技术前沿|图像去雨滴算法-神经网络-技术-爱吧机器人网

技术前沿|图像去雨滴算法

2018-07-30 极验浏览量：

技术前沿
作者：萝卜兔

在图像处理的过程中，会遇到各种各样的噪声，比如在夜晚场景下的照片会有很多噪点，在雾霾天气下会朦胧不清，在下雨天会有密密麻麻的雨滴.....所以去除图像中的各种噪声，还原清晰的图像也是CV领域的一大研究方向。萝卜兔今天便给大家介绍一些前沿的图像去雨滴算法。

用注意力对抗网络进行单图去雨

该方法是来自于今年的CVPR文章《Attentive Generative Adversarial Network for Raindrop Removal from a Single Image》，是北京大学、新加坡国立大学以及耶鲁-新加坡国大的研究成果，主要是对车窗上的水滴进行清除。

由于受各方面因素的影响，去雨问题实际是一个很复杂的问题，首先这个问题是如何建模，基本的思想是将带雨图像分解为不带雨滴的图像和受雨滴影响的图像。

其中I是就是我们需要处理的带雨滴图像，M是一个0,1掩膜, B是不带雨滴的真实背景图，R是受雨滴影响的图像。去雨的目标就是要从I中恢复出B。

这篇文章使用GAN框架来解决这个问题，创新的地方在于在生成器和判别器中引入了视觉注意力机制，让模型能够意识到哪些地方是受雨影响的，整个框架如下图，下面来看看两部分具体是如何工作的。

生成器

生成器包括两部分，一个是基于循环神经网络生成注意力热图，另一部分是上下文自编码器，用于生成去雨之后的图像。

首先来看如何生成注意力热图，作者使用了循环神经网络的结构，每个cell包括使用5层ResNet提取特征，然后送入convLSTM中生成2D的注意力热图。每一个step都使用上一时刻的注意力热图和原图作为输入，逐渐生成更精确的注意力分配图。这一部分使用掩膜M作为每个step的监督，指导注意力热图的生成。

接下来看如何生成去雨的图像。这一部分的有两个目标，一是要生成去雨的图像，而是要保证生成的图像尽可能真实。图像生成的主要框架是一个自编码器，输入是带雨图像与注意力热图，输出是去雨的图像。在损失函数上两部分Lm和Lp, Lm是一个多尺度的Loss，它是为了在解码的时候保证获得更多的上下文提升生成的图像质量，具体来讲就是讲真实的背景图像进行下采样分别用于监督解码器不同的层级，具体形式都是基于像素的MSE；Lp称为感知Loss（perceptual loss），它利用VGG16提取高层的特征进行监督来保证生成图像的质量。

判别器

判别器是为了区分出谁是真的谁是假的，对图像进行判别，可以从全局和局部两个方面进行，从局部来看就是要检查可能为假的部分，可是并没有先验的信息来告诉我们哪些位置可能为假，因此需要判别器自己去学。文章为了解决这个问题，将上一步中生成的注意力热图引入到判别器中。具体来讲，在判别器CNN的中间部分生成一个注意力分配图，将其与特征相乘之后传入下一层，注意力分配的监督工作由生成器得到的注意力热图完成，这样相当于引导判别器主要关注受雨滴影响部分的真实性。

实验效果

实现细节参照论文：
https://arxiv.org/pdf/1711.10098.pdf

RESCAN单图去雨

该论文是来自北京大学和上海交通大学的几位研究者的成果，已经入选今年的ECCV会议，他们在卷积神经网络以及循环神经网络的基础上，提出了一种新的神经网络架构RESCSN来处理单图雨滴。

这篇文章对于去雨问题的建模也是将问题进行分解，稍有不同的是将雨的影响进行了细分，认为R是由多种雨的纹路（rain streaks）组成的。另外在模型的建模目标上也有不同，上一篇文章直接去生成去雨的图像，而本文则希望去建模得到R，这样B = O - R。因此这篇文章的总体目标就是希望学到一个映射F, 使得F(O) 与 R尽可能接近。

方法

文章提出了一种称为REcurrent SE Context Aggregation Net (RESCAN)的框架，整个过程是多阶段的，逐步得到R。

每个阶段使用一种称为SCAN的结构，这个结构主要有以下几个特点：
第一是使用空洞卷积快速扩大感知野，因为在去雨中更多的上下文信息是比较关键的，比如上篇文章的多尺度的Loss；
第二个特点是使用SE模块（具体可以参考论文1），作者认为特征图的每个channel都可以看为某种Ri的表示（embedding），每个Ri都有一个对应的系数αi，通过引入SE模块，可以显式地为不同Ri赋值不同的系数。这样每个阶段都能得到某些rain streaks,也就是说每个阶段都能去除某些rain streaks。

由于一个阶段不可能将所有的rain streaks都去除，因此需要多阶段逐步地进行，这个过程通过RNN的结构来建模。

实验效果

具体技术细节参考论文：
https://arxiv.org/pdf/1807.05698.pdf

去除图像中的雨滴也有很多可以应用的地方，比如说如果自动驾驶，如果车辆要在雨天行驶的话，就需要保持良好干净的视野，再比如处理下雨天道路的监控图像以及一些需要在雨中作业的机器。虽然，这只是CV领域的一个小小细枝节，但也是可以造福我们人类的重要科技力量。

参考文献：
1. Hu, J., Shen, L., Sun, G.: Squeeze-and-excitation networks. arXiv preprint arXiv:1709.01507 (2017)
2. Qian, Rui, et al. "Attentive generative adversarial network for raindrop removal from a single image." arXiv preprint arXiv:1711.10098 (2017).
3. Li, Xia, et al. "Recurrent Squeeze-and-Excitation Context Aggregation Net for Single Image Deraining." arXiv preprint arXiv:1807.05698(2018).

精选推荐

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24] 机器人的研究在过去10年中得益于一个具有嵌入式人工智能（AI）的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建，如今在欧洲、美国、韩国、新加坡和日本的实验室......

美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11] 人工智能在当今这个时代对大家来说想必是非常熟悉的，这也是我国近十几年来一直追求的目标，未来的时间里这也将是全人类追求的目标。就目前来看，近年来，人工智能或在我国迎......

美国普渡大学研发快动作软体机器人，灵感来自变色龙舌头捕食

[2019-10-31] 本文图片均来自：Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量，向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人（巨型机甲）

[2017-03-21] 近日，亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想，他控制了一个巨大的机甲机器人。据国外媒体Verge报道，前天（3月19日），贝 ...

研究人员融合人类与AI的创造力显著提高了深度学习的表现

[2019-10-12] 由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族，可以在智能 ...

农业将为高科技行业农业机器人的应用领域

[2017-12-17] 农业正在迅速成为一个令人兴奋的高科技产业，吸引了新专业人士，新公司和新投资者。技术发展迅速，不仅提高了农民的生产能力，而且促进了我们所知道的机器人和自动化技术的发展。...

谷歌在中国成立一个新的人工智能（AI）研究中心

[2017-12-13] 谷歌正在中国建立一个新的人工智能（AI）研究中心，希望进一步扩展到中国，以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一，亚马逊，微软......

人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23] 为搜索引擎过滤信息，棋盘游戏对弈，识别图像人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

飞桨火力全开，重磅上线3D模型：PointNet++、PointRCNN！

[2020-03-26] 11 年前的「阿凡达」让少年的我们第一次戴上 3D 眼镜，声势浩大的瀑布奔流而下，星罗棋布飘浮在空中的群山，无一不体现着对生命的敬意， ...

神经网络结构在命名实体识别（NER）中的应用

[2018-01-17] 近年来，基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务—命名实体识别（Named Entity Recognition，NER）也不例外，神经网络结......

从基础概念到数学公式，这是一份520页的机器学习笔记（图文并茂）

[2018-06-19] 近日，来自SAP（全球第一大商业软件公司）的梁劲（Jim Liang）公开了自己所写的一份 520 页的学习教程（英文版），详细、明了地介绍了机器学习中的相关概念、数学知识和各......

50行代码玩转生成对抗网络GAN模型！（附源码）

[2018-07-30] 本文为大家介绍了生成对抗网络（Generate Adversarial Network，GAN），以最直白的语言来讲解它，最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06] 爱吧机器人网编者按：近日，《自然-神经科学》发表了一篇论文，研究人员创建了一种深度人工神经网络，能够准确预测生物大脑对视觉刺激所产 ...