爱吧机器人网 » 技术 > 机器学习 > 正文

机器学习对抗案例|愚弄Google图像识别算法

2018年CES在美国拉斯维加斯召开,站在风口浪尖上的科技企业纷纷出动,在会场各显神通地展示自己的科技产品和各种智能算法。近年来,人工智能的浪潮不断拍打着 IT 领域的海岸,各家科技巨头们都喜欢向外骄傲地宣布自己的算法能够如何完美地识别图片。然而事实还是能够证明图像识别算法所存在的弱点以及恶意攻击者能够针对算法弱点进行一定的利用。

\
 
算法面对的幻象和幻听
 
早在 2015 年谷歌、微软和中国百度就表示,他们的深度学习算法就已经能够在基本功能上超越人类,实现判断和识别。
 
而在 2017 年 12 月,Facebook 继续宣布了自己的人脸识别算法已经得到了升级换代,该算法在用户自己没有标记照片(只是被其他人拍到)的情况下,也能给你发送照片提醒。

\
 
但算法和人类不同。算法容易受到特定类型的问题的困扰,也就是存在“对抗案例(Adversarial Example)”。一些攻击者会精心设计出视觉假象,误导并诱使计算机作出错误判断,或者失去判断的准度,计算机就可能会把熊猫的图片识别成长臂猿。同样,这种欺诈手段不仅仅针对计算机图像,还可以是针对音频或者文字的。因此这也是一种算法能够看到的幻觉,或听见的幻听。
 
熊猫还是长臂猿,这个错误看上去可能还像是低层次的。但如果攻击者能够利用相同的方法控制自动驾驶汽车的 AI 系统,问题就会变的棘手起来。应该限速的时刻,攻击者如果能成功利用自动驾驶的算法,就可以设法让系统犯错。实际上,这样的事情已经发生,攻击者已经开始使用算法的弱点来绕过垃圾邮件过滤之类的系统。

\
 
Google Cloud Vision API
 
据麻省理工学院计算机科学与人工智能实验室 12 月公开的的研究显示,这些对抗性的例子比以前所了解的要容易得多。 该团队可靠地愚弄了Google 的 Cloud Vision API,这是一种已经应用在现实世界中的机器学习算法。
 
以往的对抗案例都是在“白盒”环境下进行实验设计和进行的,计算机研究员们在了解了驱动算法执行的计算机底层的运作原理后就可以进行针对性的探索,了解怎么做就可以欺骗他们。但这些情况下,对于案例并不具备攻击性,并没有什么威胁,因为攻击条件和现实环境相比还是离得远了些。

\
 
MIT 研究团队11月公开的结果显示,他们成功在实验中让 InceptionV3 图像分类器将一个3D打印的海龟被识别成一把来复枪。更有趣的是,他们还能将3D海龟进行一些调整,在AI识别后可以是任何其他的物件。这是一个应用3D打印条件下的对抗案例。
 
而在 MIT 最新的研究成果中,他们的研究是在黑盒条件下进行的。在事先并不获知目标算法的运行原理的情况下,他们能够设计出一种快速获取黑盒对抗案例的方法,并能应用在多种不同的图像算法上,这其中也包括了 Google 的 CloudVision API 。在谷歌案例之中,MIT的研究员们针对的是识别不同图像的系统。
 
通过轻微调整照片中的像素,图像系统能够完全把机枪的照片识别成直升机。尽管对于人眼而言,这两个图像看起来完全相同。但这些人眼可以分辨的差异却会愚弄计算机设备。他们使用通用方法来制定对抗案例,他们会分析图像识别的结果,在其他结果的方向上对图像进行调整。
 
研究人员以随机方式生成需要的标签,在机枪案例中,分类器中的“直升机”标签也可以改成“羚羊”,哪一种标签对他们而言没有差别,研究能够证明的只是这种调整像素的方法可以无差别地实现任何结果。
 
MIT的研究成果验证了,现在的攻击者也可以应用这种方法来创建对抗案例。

\
图片分类标签混淆
 
谷歌的回应与算法承担的重任
 
谷歌通常被认为是世界上最好的安全团队之一,但其最具未来主义意义的产品——智能算法却仍然可以被这种“幻觉”操纵最终的判定结果。谷歌并没有直接对研究结果进行评论。但在研究结果公布的不久之后,谷歌似乎已经看到了现在算法存在的问题,并在努力解决,他们在12月时也发布了名为《Adversarial Patch》的论文探讨相关攻击方法的策略研究。
 
现在还没有过网络犯罪份子的相关应用实例,但我们相信在不久的未来,类似思路的攻击也有一定可能成为现实,例如,黑客可以利用行李扫描算法,将一个毛绒玩具识别成爆炸物。或者,他们可以利用面部识别系统,将无辜的人识别成罪犯,而让真正的罪犯逃之夭夭。

\
科幻故事中的犯罪指数算法
 
智能算法在当代生活中的重要性与日俱增,它们负责在社交平台上过滤垃圾和无用的内容,又负责驾驶无人汽车,以及在未来的一天负责扫描行李中的武器和爆炸物。
 
然而,我们在赋予算法相关执行和决策权力的同时,也赋予了算法与之相应重量的责任和信任,对抗性案例的存在就好比是微小但却游离在之外的漏网之鱼,揭露了当前发展阶段下的不足和局限。
 
不少安全研究人员和机器学习专家正在结合企业实践和学术研究成果寻找合适的解决方案,例如将敌对的案例纳入神经网络训练之中,让新的算法了解真实和敌对案例图像的区别;当然这只是一种解决方案,也有其他研究人员提出了新的探索方向,来解决这个问题,但目前还没有确定的答案,哪种方法是有效的,哪种方法没有。
 
参考资料及PDF如下
https://arxiv.org/pdf/1412.6572v3.pdf?loc=contentwell&lnk=a-2015-paper&dom=section-9
https://arxiv.org/abs/1512.00567
https://arxiv.org/pdf/1712.09665.pdf
https://www.labsix.org/physical-objects-that-fool-neural-nets
https://www.wired.com/2016/07/fool-ai-seeing-something-isnt/
https://www.wired.com/story/machine-learning-backdoors/
https://www.wired.com/2016/07/fool-ai-seeing-something-isnt/
https://boingboing.net/2018/01/08/what-banana.html
https://blog.openai.com/adversarial-example-research/
 
*本文作者Elaine,转载请注明FreeBuf.COM


上一篇:图灵奖得主Judea Pearl:机器学习无法成为强AI基础,突破口在“因果革命”
下一篇:Facebook如何运用机器学习进行十亿级用户数据处理
精选推荐
机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...