爱吧机器人网 » 技术 > 神经网络 > 正文

技术前沿|图像去雨滴算法

技术前沿 
作者:萝卜兔

在图像处理的过程中,会遇到各种各样的噪声,比如在夜晚场景下的照片会有很多噪点,在雾霾天气下会朦胧不清,在下雨天会有密密麻麻的雨滴.....所以去除图像中的各种噪声,还原清晰的图像也是CV领域的一大研究方向。萝卜兔今天便给大家介绍一些前沿的图像去雨滴算法。

用注意力对抗网络进行单图去雨

该方法是来自于今年的CVPR文章《Attentive Generative Adversarial Network for Raindrop Removal from a Single Image》,是北京大学、新加坡国立大学以及耶鲁-新加坡国大的研究成果,主要是对车窗上的水滴进行清除。

由于受各方面因素的影响,去雨问题实际是一个很复杂的问题,首先这个问题是如何建模,基本的思想是将带雨图像分解为不带雨滴的图像和受雨滴影响的图像。
其中I是就是我们需要处理的带雨滴图像,M是一个0,1掩膜,  B是不带雨滴的真实背景图,R是受雨滴影响的图像。去雨的目标就是要从I中恢复出B。


这篇文章使用GAN框架来解决这个问题,创新的地方在于在生成器和判别器中引入了视觉注意力机制,让模型能够意识到哪些地方是受雨影响的,整个框架如下图,下面来看看两部分具体是如何工作的。


生成器

生成器包括两部分,一个是基于循环神经网络生成注意力热图,另一部分是上下文自编码器,用于生成去雨之后的图像。

首先来看如何生成注意力热图,作者使用了循环神经网络的结构,每个cell包括使用5层ResNet提取特征,然后送入convLSTM中生成2D的注意力热图。每一个step都使用上一时刻的注意力热图和原图作为输入,逐渐生成更精确的注意力分配图。这一部分使用掩膜M作为每个step的监督,指导注意力热图的生成。

接下来看如何生成去雨的图像。这一部分的有两个目标,一是要生成去雨的图像,而是要保证生成的图像尽可能真实。图像生成的主要框架是一个自编码器,输入是带雨图像与注意力热图,输出是去雨的图像。在损失函数上两部分Lm和Lp, Lm是一个多尺度的Loss,它是为了在解码的时候保证获得更多的上下文提升生成的图像质量,具体来讲就是讲真实的背景图像进行下采样分别用于监督解码器不同的层级,具体形式都是基于像素的MSE;Lp称为感知Loss(perceptual loss),它利用VGG16提取高层的特征进行监督来保证生成图像的质量。

判别器

判别器是为了区分出谁是真的谁是假的,对图像进行判别,可以从全局和局部两个方面进行,从局部来看就是要检查可能为假的部分,可是并没有先验的信息来告诉我们哪些位置可能为假,因此需要判别器自己去学。文章为了解决这个问题,将上一步中生成的注意力热图引入到判别器中。具体来讲,在判别器CNN的中间部分生成一个注意力分配图,将其与特征相乘之后传入下一层,注意力分配的监督工作由生成器得到的注意力热图完成,这样相当于引导判别器主要关注受雨滴影响部分的真实性。

实验效果
实现细节参照论文:
https://arxiv.org/pdf/1711.10098.pdf

RESCAN单图去雨

该论文是来自北京大学和上海交通大学的几位研究者的成果,已经入选今年的ECCV会议,他们在卷积神经网络以及循环神经网络的基础上,提出了一种新的神经网络架构RESCSN来处理单图雨滴。

这篇文章对于去雨问题的建模也是将问题进行分解,稍有不同的是将雨的影响进行了细分,认为R是由多种雨的纹路(rain streaks)组成的。另外在模型的建模目标上也有不同,上一篇文章直接去生成去雨的图像,而本文则希望去建模得到R,这样B = O - R。因此这篇文章的总体目标就是希望学到一个映射F, 使得F(O) 与 R尽可能接近。

方法

文章提出了一种称为REcurrent SE Context Aggregation Net (RESCAN)的框架,整个过程是多阶段的,逐步得到R。

每个阶段使用一种称为SCAN的结构,这个结构主要有以下几个特点:
第一是使用空洞卷积快速扩大感知野,因为在去雨中更多的上下文信息是比较关键的,比如上篇文章的多尺度的Loss;
第二个特点是使用SE模块(具体可以参考论文1),作者认为特征图的每个channel都可以看为某种Ri的表示(embedding),每个Ri都有一个对应的系数αi,通过引入SE模块,可以显式地为不同Ri赋值不同的系数。这样每个阶段都能得到某些rain streaks,也就是说每个阶段都能去除某些rain streaks。

由于一个阶段不可能将所有的rain streaks都去除,因此需要多阶段逐步地进行,这个过程通过RNN的结构来建模。
实验效果



具体技术细节参考论文:
https://arxiv.org/pdf/1807.05698.pdf

去除图像中的雨滴也有很多可以应用的地方,比如说如果自动驾驶,如果车辆要在雨天行驶的话,就需要保持良好干净的视野,再比如处理下雨天道路的监控图像以及一些需要在雨中作业的机器。虽然,这只是CV领域的一个小小细枝节,但也是可以造福我们人类的重要科技力量。

参考文献:
1. Hu, J., Shen, L., Sun, G.: Squeeze-and-excitation networks. arXiv preprint arXiv:1709.01507 (2017)
2. Qian, Rui, et al. "Attentive generative adversarial network for raindrop removal from a single image." arXiv preprint arXiv:1711.10098 (2017).
3. Li, Xia, et al. "Recurrent Squeeze-and-Excitation Context Aggregation Net for Single Image Deraining." arXiv preprint arXiv:1807.05698(2018).



上一篇:计算机视觉领域前沿一览
下一篇:AutoMl及NAS概述:更有效地设计神经网络模型工具
精选推荐
科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

本周栏目热点

飞桨火力全开,重磅上线3D模型:PointNet++、PointRCNN!

[2020-03-26]  11 年前的「阿凡达」让少年的我们第一次戴上 3D 眼镜,声势浩大的瀑布奔流而下,星罗棋布飘浮在空中的群山,无一不体现着对生命的敬意, ...

从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂)

[2018-06-19]  近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细、明了地介绍了机器学习中的相关概念、数学知识和各......

50行代码玩转生成对抗网络GAN模型!(附源码)

[2018-07-30]  本文为大家介绍了生成对抗网络(Generate Adversarial Network,GAN),以最直白的语言来讲解它,最后实现一个简单的 GAN 程序来帮助大家加深理解。...

神经网络和模糊逻辑的工作流

[2016-11-20]   行业观察 神经网络 和模糊逻辑的工作流 null 来源:神州数码erp 发布时间: 2009-10-14 9:06:01 关键词: 工作流,协同,B2B,OA  以下 ...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...