爱吧机器人网 » 专题 > 应用 > 正文

手机摄影已经进入深水区 AI将为我们重塑摄像头

AI人工智能除了会与机器人结合,除了会衍生出一系列的新产品之外,它也会与我们传统的手机相结合,而移动AI芯片,便是手机与人工智能结合衍生出来的新事物,而当两种技术发生碰撞,它会带来怎样的变化呢?无可厚非,摄像头成为最受瞩目的焦点!

手机摄像头
 

从技术逻辑上讲,搭载AI运算处理单元后的手机,结合本身GPU的图像处理能力,最显著的能力提高就是在图像内容生成、识别和处理上。无论是美颜、美景还是美视频,算法都能给你美出来。

但事实上,高端机们不得不齐齐拥抱AI背后,或许还有更深层次的产业矛盾和现实问题。手机AI也不止带来了“拍照更好看”的简单提升。

本文中,我们将引用华为Mate 10、iPhone X和谷歌Pixel 2三款加入了AI能力与运算单元的智能手机,来讨论AI带给手机摄像头与拍摄功能的改变。

曾经我们认为手机只能打电话发短信,之后buang的一声,手机被炸成了今天“无所不能”的智能机。随着AI的到来,摄像头可能也在经历一场类似的爆炸。

手机摄影已经进入深水区,创造差异只能用AI

为什么在短短几个月之间,苹果、谷歌、华为的主流旗舰机都宣布进入了AI时代?

最直接的原因,显然在于高端机之间不可避免年年上演的拍照能力大战,打到如今已经进入了无比惨烈的拼刺刀阶段。

曾经跟一个爱写手机拍照评测的摄影师朋友聊天,他认为这两年写手机拍照评测真的是很痛苦的一件事。因为近似价位的手机之间,拍照能力实在太接近了。拍了各个场景的对比图,一会这家强,一会那家强,根本归纳不出结果来。即使严格按照DxOMARK这种专业机构的评测标准来做,结果还是五花八门。

也有人觉得,在手机光学硬件和摄像单元上,摩尔定律已经接近失效了。随着双镜头、大光圈、千万以上像素摄像头成为标配,摄像头的核心单元群落似乎已经被固化。但手机还是要年年出,年年有改进。更要命的是对于高端机来说,摄像部分是绝对的血海厮杀,绝不能落人一头——想想手机背后的研发者和产品经理们,也是够头疼的。

即使领军的苹果,这几年在摄像头也是前进的举步维艰。甚至打开一些专业评测网站的照片,普通用户很可能分辨不清两代机型,以及竞品机型拍摄照片之间到底有什么差别。

毕竟不是每个人都是摄影师和艺术家,有那么细致的分辨能力。所以为了让消费者继续感知拍照能力在变化,必须在摄像单元之外想办法——于是AI似乎成了最好的选择。

人工智能技术的引入,或许意味着手机可以凭借基础硬件的改变和大量算法助阵,来提升手机在拍摄、录制时的体验。创造更多的玩法、更简单的体验,摆脱在光圈、像素等少数几个领域的无尽纠缠。对于渴望新消费增长点的手机厂商来说绝对是一场惊喜。

更重要的是,AI算力与算法在手机拍摄中的应用,可以有多种模式和方法。很难想象秘密研发的旗舰机会在AI应用细节上撞车。这点在华为Mate 10和iPhone 8/X之间的差异化中已经可见一斑,而这只是个开始,更多技术与开发生态成熟后,两款旗舰机之间的差距只会越来越大。这是手机厂商们求之不得的。

脱离同质化竞争的苦海,恐怕只能靠AI。所以,AI来了......

最后的战役:算法和硬件能力填补特殊场景

当然,AI可能改变手机的拍摄战争,绝不是说这场战役就不继续下去了。

事实上,在开创新玩法之前,AI帮助手机拍摄完成的最后一场战役,还是会聚焦在主流手机攻坚了许多年的战场:特殊场景拍摄。

这里所谓的特殊场景,包括夜景、强光、暗光、动态捕捉几个方面,具体应用的例子更是花样繁多。因为手机的摄像头注定没有纵深,所以无法像单反摄像头一样来处理极限光环境下的成像效果。因此暗光、强光环境下的拍摄,也逐渐成为评价一款手机摄像能力好坏的基本要素。

看一下DxOMARK的手机拍摄评分排名,会发现前五已经基本被AI手机所占据。而这些手机拍照能力的重要加分项,就来自算法对光线环境的捕捉和平衡推导。比如谷歌谷歌Pixel 2会采用复杂的算法,比如对摄像头收集信息进行拆分和模块深度学习,来达成精神效果和光源重绘。因此在白光处理上获得了高分。

DxOMARK评测图
 

在DxOMARK的这张评测图中,可以看出应用了AI算法帮忙之后,各家旗舰机在处理光影关系时都较以前的纯光学模式有了显著改善,尤其是在匹配阴影与光亮的结构关系上。

算法捕捉技术不仅作用于静态拍照中,更多体现在高速运动环境下通过算法来实现超高速对焦,以及在暗光环境下完成的识别+拍摄。

AI+手机拍摄,还能在比较复杂的动作和特殊光线下实现动态美颜与视频美化。利用底层硬件+算法,智能机可以实现了单靠摄像头无法达成的很多功能。

但这只是提升,AI到来的真正意义在于让很多所谓“常识”发生改变…..

直男救星:用AI的识别能力解放人类拍照

请假设你是一位不热爱拍照,但热爱女朋友的直男……当你使用昂贵手机给女友拍照的时候,第一感觉是什么?

开心?忐忑?NO,你的第一感觉是复杂到心累。你会发现手机上一大堆功能,一会要HDR,一会要美颜美肤,一会要大光圈背景虚化,一会要景深模式......这要是赶上个暴脾气,不是扔手机就是扔女朋友。

事实上,会产生如此复杂的操作和专有名词。是因为为了处理不同的拍摄对象和场景,手机必须模仿相机的模式,给出不同的曝光、白平衡和对焦策略。但更多的功能意味着更复杂的操作,世界上还是手残党多一点,是否能免去这一步呢?

对于AI加入手机这件事,或许一个十分值得兴奋的点在于,AI的主要能力之一在于识别和理解图像。换言之,通过识别后的图像信息自动触发功能对应,或许意味着可以把无知的直男们解放出来。

比如谷歌的Pixel 2就很大程度上利用了AI的识别能力来拍照。在它的摄像单元里,隐藏着一个神经网络算法,专门用来分辨拍摄中的人物信息。然后传输到后端进行不同阶段的对应图片处理。

当然,谷歌的这个技术主要目的是让但摄像头来获取双摄的美颜拍照背景虚化能力。而华为Mate 10的识别+拍摄,也即其宣传的“智慧摄影”模式似乎是更激进的方案。Mate 10的处理方式,是通过NPU来先期学习图片的信息特征,从而获得给拍照对象分类的能力。然后组织成13种拍照模式。

当摄像头在拍摄时触发了这种模式,手机将自动调到对应的模式。

事实上,这种先识别后拍摄的模式很可能在短期内成为通行的标配,甚至取代一部分常用功能。毕竟在我们日常生活和社交中,拍摄照片的目的和期望效果是有高度一致性的。通过AI带来的深度学习能力归纳这些特性,智能化完成用户期许,或许才是未来摄影的常态。

也许不久的将来,你到了海边结果下雨,到了景区遇上雾霾,到了好莱坞没有大明星,就可以用AI来造蓝天白云青山绿水,甚至弄出来几个偶尔路过的明星侧影.....

当然,AI的识别+拍摄能力,真正应该解放的是老人、孩子以及大多数只是偶尔采用手机拍照的普通人。毕竟我们大多数人无暇学习复杂的教程,锤炼高超的审美,但我们还是希望让精心准备的一刻留下更漂亮的记忆。

AI让世界更公平,也许正是如此。

已经发生的大爆炸:摄像头不只用来拍照

上面介绍了两种可见的AI+摄像头模式:AI提升拍摄和AI改变拍摄。而AI还带给摄像头另一种赋能:不只用来拍摄。

目前所见,这重功能已经有两种思路:第一种iPhone X为代表的,在感知能力上做文章,将摄像头与传感部件结合生成新的体验与功能。

iPhone X摄像头在结合了新的感光元件以外,更重要的是加入了相当复杂的传感器系统。尤其是在前置摄像头上,用“刘海”里原深感摄像头实现了生物识别和动态捕捉,达成了Animoji和人像光效等特色功能。

另外Face ID也是通过类似功能来实现的结构光识别。泛光感应元件还能在暗光状态下帮助用户解锁手机。这种思路或许意味着,摄像头以后不仅仅是“看见”,而更多可以“感知”外在。目前作用仅仅是人脸识别和一些特色功能,但距离运用硬件和算法基础开发更多功能应该已经不远了。

而另一种模式,是通过摄像头本身的机器视觉能力来获得数据学习和智能体成长能力。加入记忆和学习能力的AI摄像头不仅是记录影像信息,并且还会在本地完成对这些信息的学习和理解。从而适应用户习惯,达成更好的拍摄体验。

这两种方式都意味着,手机AI带来的不仅是摄像能力本身的提升。而是将摄像头作为信息采集方式之一,纳入更庞大的能力体系里。以此培养出手机的精准识别能力、多元数据处理能力、内容输出能力,这对于未来才是至关重要的。

或许等到开发者开始集体思考这些能力意味着什么,移动AI带给影像世界的真正价值才会浮现出来。

AI可以改变手机的很多方面,但从根本上说,它想改变的是被看做常识的人机交互方式。


上一篇:人工智能的到来到底为学生教育带来了怎样的改变
下一篇:有趣的AI 它能为你设计更受欢迎的万圣节套装
精选推荐
Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

南加州大学机器人学家:机器人更适合粗暴的爱
南加州大学机器人学家:机器人更适合粗暴的爱

[2019-11-07]  图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱,当人类粗暴的将物体从机器人手中敲掉,看似残忍,实际上却能帮助机器人找到最好的握持物 ...

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

本周栏目热点

[2017-08-29]    8月25日,在日本木更津,狼型机器人超级怪兽狼站在稻田边,威慑可能危害庄稼的野生动物。当野生动物接近庄稼地,装有红外感应器的机器 ...

雾计算应用案例分析:无人机领域快递的应用

[2016-09-01]      导读: 无人机,是典型的物联网相关应用。传统的快递行业,面临着巨大的人员开销,设备成本,安全问题。然而,无人机快递,却可以精 ...

Air wheel平衡车虎嗅千里送车行:“卖萌”文创的故宫淘宝

[2015-12-23]     摘要:提到故宫,你会想起什么?恢弘气势、历史感十足?还是脑洞大开的一系列文创产品?近日,Airwheel的工作人员便带着Airwheel&虎嗅 ...

以品质立足世界,纳斯达克大屏上的Airwheel平衡车

[2015-12-23]     摘要:12月15日,Airwheel在美国证券交易所纳斯达克广告屏上对旗下的产品以及所推崇的出行理念进行宣传投放。在12月12日亚马逊全线封禁 ...

揭秘!越来越多编辑部开始自动化办公,AI会取代编辑吗?

[2018-05-22]  有人说,机器人和人工智能是下一场工业革命,它们会比以往的工业革命——蒸汽、电、计算机更具颠覆性,因为它们不仅仅会取代常规,还会取代 ...