爱吧机器人网 » 技术 > 机器学习 > 正文

人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习

人工智能利用单眼强度图像进行面部深度图估计的对抗架构(特约点评:利用单眼强度图像进行面部深度图估计的对抗架构对于生成对抗网络的研究指出了新的方向,这个创新点趣说人工智能必须推荐。来自网友大鹏的推荐!)

人工智能利用单眼强度图像进行面部深度图估计的对抗架构摘要:在本文中,提出了一种用单眼强度图像进行面部深度图估计的对抗架构。 通过遵循图像到图像的方法,我们结合了监督学习和对抗训练的优势,提出了一个有条件的生成对抗网络,有效地学习将强度人脸图像转换为相应的深度图。 两个公共数据集,即Biwi数据库和Pandora数据集,被用来证明所提出的模型生成高质量的合成深度图像,无论是在视觉外观和信息内容方面。 此外,我们证明该模型能够通过深度模型测试生成的深度图来预测独特的面部细节,深度模型是在真实的深度图上进行面部验证任务的训练。

人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习

人工智能利用单眼强度图像进行面部深度图估计的对抗架构简介:深度估计是一项任务,在这个任务中,由于存在两个高质量的立体相机(即人眼)和一个特殊的学习工具(即人类大脑),人类会自然而然地获益。什么让人类在评估单个单眼图像的深度方面如此卓越以及这种学习过程如何发生?一个假设是,我们通过过去的视觉经验来开发教师来估计世界的三维结构,这包括与触觉刺激(对于小物体)和运动(对于更宽的空间)相关的大量观察结果)[43]。这个过程允许人类开发推测他们所看到的物体和场景的结构模型的能力,甚至可以从单眼图像中推断出来。

人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习

尽管深度估计是一种自然的人类大脑活动,但由于不同的三维地图可能会生成相同的二维图像,因此该任务在计算机视图环境中是一个不适合的问题。此外,由于属于强度图像和深度图的极其不同的信息来源,纹理和形状数据分别在这两个域之间进行翻译是非常困难的。传统上,计算机视觉界广泛地以不同的方式解决了深度估计问题,如立体相机[16,40],运动结构[4,6],以及来自阴影和光扩散的深度[35,37]。所提及的方法遭受不同的问题,如深度均匀性和缺失值(导致深度图像中的空洞)。其他具有挑战性的元素与摄像机校准,设置和后处理步骤相关,这些步骤可能会耗费大量时间和计算成本。最近,由于深度神经网络的进步,研究团队已经从强度图像中研究了单一深度估计任务,以克服以前报告的问题。

人工智能利用单眼强度图像进行面部深度图估计的对抗架构贡献:本文提出了一个从人脸单眼强度图像生成深度图的框架。采用对抗方法[12,28]来有效地训练完全卷积自动编码器,该编码器能够根据相应的灰度级图像估计面部深度图。为了训练和测试所提出的方法,利用由大量成对深度和强度图像组成的两个公共数据集,即Pandora [3]和Biwi Kinect Head Pose [9]数据集。就我们所知,这是通过与全球深度场景估计不同的对抗性方法来尝试解决这一任务的最初尝试之一,它涉及小尺寸物体和充满细节的人脸:人脸。最后,我们研究如何有效地衡量系统的性能,引入各种按像素指标。此外,我们引入了一个人脸验证模型,对原始人脸深度图像进行训练,以检查生成的图像是否保持原始人物的面部特征,不仅在人类视觉检查时,而且在深度卷积网络处理时。

人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习

人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习结构:在本节中,我们提出了用于人脸强度图像深度估计的模型,详细描述了cGAN体系结构,其训练过程和采用的预处理人脸裁剪算法(第3.2节)。 该模型的实施遵循[12]中提出的指导方针。在Goodfellow等人的工作之后。 [12]和米尔扎等人。 [28],所提出的体系结构由一个生成网络tt和一个判别网络d tt对应于一个估计函数,该函数预测给定人脸灰度图像强度的深度图Igen = tt(Igray) 图像作为输入并估计相应的深度图。(目标韩函数包含对抗损失和mse损失)。

人工智能利用单眼强度图像进行面部深度图估计的对抗架构深度学习结论:在本文中,我们提出了一种从强度图像估计面部深度图的方法。 为了评估生成图像的质量,我们使用在原始深度图上预先训练好的Siamese网络执行人脸验证任务。 通过显示在生成的图像上进行测试时,连体网络的精度不会降低,我们证明了提供的框架可以生成高质量的深度图,无论是在视觉外观还是区分性信息方面。 我们还证明,提出的架构胜过自动编码器和文献竞争对手时,在训练对手政策。由于我们方法的灵活性,我们计划通过引入任务特定的损失来扩展我们的模型,并将其应用于不同的场景。


上一篇:深度学习的可解释性研究(一):让模型「说人话」
下一篇:人工智能算法--决策树(DT)
精选推荐
2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...