谷歌方面强调,不会在这款小程序内收集任何与用户隐私相关的数据。
本文共计2670字,阅读时间4分钟。
本文为寻找中国创客(ID:xjbmaker)原创
记者 / 蔡浩爽
编辑 / 魏佳
谷歌一定是全球最会做营销的人工智能公司,没有之一。
2016年,谷歌阿尔法狗与人类顶级棋手对弈,让全人类意识到人工智能时代的到来;2018 Google I/O开发者大会上,Google Assistant像真人助理一样通过电话完成预约理发服务,宣告人工智能距离“成精”又近一步;今天,谷歌的你画我猜小程序“猜画小歌”刷屏朋友圈,让普罗大众都有“调戏”人工智能的机会。
“AI没有你想象中的那么神奇,可以上天入地干掉人类;也没有你想象中的那么智障,还是可以做一些传统代码做不到的事情的。”谷歌的猜画小歌研发团队人员如此解释上线这一小程序的目的。
猜画小歌炸出了朋友圈一票灵魂画手,其不按套路出牌的识别能力让人又爱又恨:猜画小歌有时候很懂你,画一笔就知道你要画什么;有时候又着实智障,明明画得很具体了,它却用机械音嘲弄你:“你画的啥玩意。”有绘画功底的画手往往难以通关,抽象派的灵魂画手反而能被识别。网友忍不住质疑:这 AI 怕不是个傻子吧?
猜画小歌背后使用了哪些技术?这一技术未来可以应用在哪些领域?谷歌AI团队就这些问题接受了寻找中国创客(ID:xjbmaker)的采访。
猜画原理
技术不难,难的是数据库
我们先简单介绍一下这款小程序游戏的玩法:系统给出一个需要画的词语,通常是名词,在20秒的时间内,用户画AI猜,猜中即可进入下一轮。AI从你画第一笔就开始猜,常常在你画出某些特征后就给出答案。如果猜不中,AI还会用机械音嘲笑:你画的啥玩意。
据开发人员介绍,这款小程序最初只是团队hackathon的小想法,因为大家觉得有趣,才发展成了完整的项目。
所谓hackathon,中文一般称为黑客马拉松或者编程马拉松,是科技公司激发创意的一个小比拼。常见的做法是公司内程序员、设计师以及产品人员组成小队,在一到两天的时间内紧密配合,完成一个主题下的产品或者解决方案。
2016年以来,微信小程序因为已经封装了很多组件、提供了很多接口,开发相对简单、快速,成为了很多互联网公司首选的hackathon主题。猜画小歌就是在这样的环境中诞生的。
Google AI工作人员告诉寻找中国创客(ID:xjbmaker),猜画小歌由来自Google AI的神经网络驱动。该网络源自全世界最大的、囊括超过5000万个手绘素描的数据群。
2016年,谷歌曾推出网页版你画我猜——quick,draw!一经上线就风靡全球,通过该游戏手机到的手绘数据集也被谷歌开源,为需要神经网络训练的研发人员提供样本。quick,draw!使用了David Ha与Douglas Eck研究的名为“sketch-rnn”的生成式RNN,旨在训练机器如何像人类一样提炼事物的抽象概念。
至于这次猜画小歌具体使用的是神经网络技术中的卷积神经网络技术(CNN)还是递归神经网络技术(RNN),谷歌方面表示:无法分享关于神经网络架构的相关信息。
“其实用CNN或RNN只不过是个选择题,这两种神经网络各有长处,但归根结底都是DeepLearning(深度学习)的事情。” 人工智能独角兽企业旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)。
神经网络是深度学习的基础,最初是受生物神经系统的启发,为了模拟生物神经系统而出现的。通俗点说,AI 通过神经网络认知世界的过程,与婴儿最初认知世界的过程颇有点异曲同工的意思。
包括旷视研究院在内的人工智能公司所研究的人脸识别、视频结构化等技术,均绕不开CNN或RNN。
但抛开这些拗口的技术名词,这款手绘识别游戏的技术并不难。早在去年,就有一名在校生帮一个公司做过一个几乎差不多的手绘识别模型,收取的酬劳仅有一万元。相比于算法,数据集在这里显然更值钱。
回想一下,我们人类会通过识图卡片、绘画等来培养孩子识别周遭事物的能力,这些图画并不一定像照片一样逼真,但包含了事物的显性特征,传递出了人们如何重现与重构身边事物的方法。比如猫有三根胡须、汽车有四个轮子、人脸有两只眼睛一个鼻子一张嘴、金毛是有金色毛发的温顺狗狗等。“AI 对简笔画的理解也是基于数据库的训练。”旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)。
利用神经网络技术,通过对大量涂鸦样本的学习,猜画小歌总结出不同事物的特征点。除了特征点,数据训练也可以给AI动态的画图过程,让AI理解人类在画某一事物时通常选择第一笔先画什么、如何走笔、合适停笔。这也解释了为何有时在你画第一笔时,小歌就能给出答案。
数据库规模越庞大,结果准确率越高。谷歌研发人员表示,为了让AI能够猜出大家的画作,已经提前喂了大量的数据给模型。
答“阴谋论”:不会收集用户隐私数据
虽然朋友圈的灵魂画手们玩得不亦乐乎,但依然有不少网友对人工智能保持着高度警惕:“感觉这个小程序有大阴谋啊,这要是都识别了,数据收集起来,谷歌不得了了,机器人可以识别所有东西了。”
还有人担心自己不知不觉成为谷歌的免费训练师,用自己的画作丰富了谷歌的涂鸦数据集。
研发人员回应:这其实是大家想多了。“大家的画作,除非能达到一定的量级,不然是不会对AI本身产生重大的影响的。”
谷歌方面也对寻找中国创客(ID:xjbmaker)强调,不会在这款小程序内收集任何与用户隐私相关的数据。
谷歌方面也对寻找中国创客强调,不会在这款小程序内收集任何与用户隐私相关的数据。
但其实,谷歌并未正面回应是否会将用户涂鸦用于丰富手绘数据库。旷视科技研究人员认为,用小程序上的涂鸦来丰富数据库是必然的。
而旷视研究人员则认为,用小程序上的涂鸦来丰富数据库是必然的。
在应用前景方面,鉴于该数据集可以训练机器提炼事物的抽象概念、学习动态画图过程,这就为这一技术创造了一个前景可观的应用方向:帮助艺术家迸发艺术灵感、教授学生绘画的基本技巧。
除了锻炼AI 能力,猜画小歌收集的数据或许也可以有其他用武之地,比如分析一下为什么大多数人画钟表都是在3点钟。
业内有观点认为,谷歌此次用小程序试水,不失为回归中国市场的投石问路之举。
2017年12月,谷歌宣布成立谷歌AI中国中心,整合谷歌云与谷歌中国研发团队,由斯坦福大学计算机系终身教授、斯坦福大学人工智能实验室主任、"AI 女神"李飞飞与Google Cloud研发负责人李佳领导。
谷歌AI中国中心介绍,目前Google翻译和文件极客App可在中国使用,搭载Android Wear系统的可穿戴产品在中国也非常受欢迎。
登顶攻略:注意突出特征和勾勒形状
有一定绘画基础的汤包同学在朋友圈里愤愤不平:既然已经喂了这么多数据,为什么我的小歌还是表现得像个智障?
汤包画的鱼是这样的:
系统认可的鱼是这样的:
汤包笔下的眼镜是这样的:
而实际上想要被AI识别出,只需要画两个圆圈:
小S(化名)为了画出“动物迁徙”,费劲巴拉地画了两只行进中的斑马,但实际上,她只需要画两只大雁——也就是两条折线就好。
“这可能是因为它之前训练的数据集以简笔画为主,复杂的反而不认识。”旷视科技研究人员认为,小歌出现的这个bug 还是跟数据集有关,“它现在还不够聪明。”
那么,怎么才能让小歌更容易地识别出你的涂鸦?
一个诀窍是抓住特征。
比如画猪突出硕大的鼻孔,画蚊子突出尖尖的嘴,画蒙娜丽莎的微笑先画个画框。
第二个诀窍是先勾勒形状,画脸先画圆圈,画微波炉先画个正方形,小歌多猜几次总能猜对。
当然,反推下来,如果你想为难一下小歌,大可以颠倒以往的下笔顺序,画图时先画细节,这样无论你画得有多像,小歌都有很大概率识别不出。