爱吧机器人网 » 专题 > 观点 > 正文

和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

谷歌方面强调,不会在这款小程序内收集任何与用户隐私相关的数据。

本文共计2670字,阅读时间4分钟。

本文为寻找中国创客(ID:xjbmaker)原创

记者 / 蔡浩爽

编辑 / 魏佳

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
谷歌一定是全球最会做营销的人工智能公司,没有之一。

2016年,谷歌阿尔法狗与人类顶级棋手对弈,让全人类意识到人工智能时代的到来;2018 Google I/O开发者大会上,Google Assistant像真人助理一样通过电话完成预约理发服务,宣告人工智能距离“成精”又近一步;今天,谷歌的你画我猜小程序“猜画小歌”刷屏朋友圈,让普罗大众都有“调戏”人工智能的机会。

“AI没有你想象中的那么神奇,可以上天入地干掉人类;也没有你想象中的那么智障,还是可以做一些传统代码做不到的事情的。”谷歌的猜画小歌研发团队人员如此解释上线这一小程序的目的。

猜画小歌炸出了朋友圈一票灵魂画手,其不按套路出牌的识别能力让人又爱又恨:猜画小歌有时候很懂你,画一笔就知道你要画什么;有时候又着实智障,明明画得很具体了,它却用机械音嘲弄你:“你画的啥玩意。”有绘画功底的画手往往难以通关,抽象派的灵魂画手反而能被识别。网友忍不住质疑:这 AI 怕不是个傻子吧?

猜画小歌背后使用了哪些技术?这一技术未来可以应用在哪些领域?谷歌AI团队就这些问题接受了寻找中国创客(ID:xjbmaker)的采访。

猜画原理

技术不难,难的是数据库

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
我们先简单介绍一下这款小程序游戏的玩法:系统给出一个需要画的词语,通常是名词,在20秒的时间内,用户画AI猜,猜中即可进入下一轮。AI从你画第一笔就开始猜,常常在你画出某些特征后就给出答案。如果猜不中,AI还会用机械音嘲笑:你画的啥玩意。

据开发人员介绍,这款小程序最初只是团队hackathon的小想法,因为大家觉得有趣,才发展成了完整的项目。

所谓hackathon,中文一般称为黑客马拉松或者编程马拉松,是科技公司激发创意的一个小比拼。常见的做法是公司内程序员、设计师以及产品人员组成小队,在一到两天的时间内紧密配合,完成一个主题下的产品或者解决方案。

2016年以来,微信小程序因为已经封装了很多组件、提供了很多接口,开发相对简单、快速,成为了很多互联网公司首选的hackathon主题。猜画小歌就是在这样的环境中诞生的。

Google AI工作人员告诉寻找中国创客(ID:xjbmaker),猜画小歌由来自Google AI的神经网络驱动。该网络源自全世界最大的、囊括超过5000万个手绘素描的数据群。

2016年,谷歌曾推出网页版你画我猜——quick,draw!一经上线就风靡全球,通过该游戏手机到的手绘数据集也被谷歌开源,为需要神经网络训练的研发人员提供样本。quick,draw!使用了David Ha与Douglas Eck研究的名为“sketch-rnn”的生成式RNN,旨在训练机器如何像人类一样提炼事物的抽象概念。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
至于这次猜画小歌具体使用的是神经网络技术中的卷积神经网络技术(CNN)还是递归神经网络技术(RNN),谷歌方面表示:无法分享关于神经网络架构的相关信息。

“其实用CNN或RNN只不过是个选择题,这两种神经网络各有长处,但归根结底都是DeepLearning(深度学习)的事情。” 人工智能独角兽企业旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

神经网络是深度学习的基础,最初是受生物神经系统的启发,为了模拟生物神经系统而出现的。通俗点说,AI 通过神经网络认知世界的过程,与婴儿最初认知世界的过程颇有点异曲同工的意思。

包括旷视研究院在内的人工智能公司所研究的人脸识别、视频结构化等技术,均绕不开CNN或RNN。

但抛开这些拗口的技术名词,这款手绘识别游戏的技术并不难。早在去年,就有一名在校生帮一个公司做过一个几乎差不多的手绘识别模型,收取的酬劳仅有一万元。相比于算法,数据集在这里显然更值钱。

回想一下,我们人类会通过识图卡片、绘画等来培养孩子识别周遭事物的能力,这些图画并不一定像照片一样逼真,但包含了事物的显性特征,传递出了人们如何重现与重构身边事物的方法。比如猫有三根胡须、汽车有四个轮子、人脸有两只眼睛一个鼻子一张嘴、金毛是有金色毛发的温顺狗狗等。“AI 对简笔画的理解也是基于数据库的训练。”旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

利用神经网络技术,通过对大量涂鸦样本的学习,猜画小歌总结出不同事物的特征点。除了特征点,数据训练也可以给AI动态的画图过程,让AI理解人类在画某一事物时通常选择第一笔先画什么、如何走笔、合适停笔。这也解释了为何有时在你画第一笔时,小歌就能给出答案。

数据库规模越庞大,结果准确率越高。谷歌研发人员表示,为了让AI能够猜出大家的画作,已经提前喂了大量的数据给模型。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

答“阴谋论”:不会收集用户隐私数据



虽然朋友圈的灵魂画手们玩得不亦乐乎,但依然有不少网友对人工智能保持着高度警惕:“感觉这个小程序有大阴谋啊,这要是都识别了,数据收集起来,谷歌不得了了,机器人可以识别所有东西了。”

还有人担心自己不知不觉成为谷歌的免费训练师,用自己的画作丰富了谷歌的涂鸦数据集。

研发人员回应:这其实是大家想多了。“大家的画作,除非能达到一定的量级,不然是不会对AI本身产生重大的影响的。”

谷歌方面也对寻找中国创客(ID:xjbmaker)强调,不会在这款小程序内收集任何与用户隐私相关的数据。

谷歌方面也对寻找中国创客强调,不会在这款小程序内收集任何与用户隐私相关的数据。

但其实,谷歌并未正面回应是否会将用户涂鸦用于丰富手绘数据库。旷视科技研究人员认为,用小程序上的涂鸦来丰富数据库是必然的。

而旷视研究人员则认为,用小程序上的涂鸦来丰富数据库是必然的。

在应用前景方面,鉴于该数据集可以训练机器提炼事物的抽象概念、学习动态画图过程,这就为这一技术创造了一个前景可观的应用方向:帮助艺术家迸发艺术灵感、教授学生绘画的基本技巧。

除了锻炼AI 能力,猜画小歌收集的数据或许也可以有其他用武之地,比如分析一下为什么大多数人画钟表都是在3点钟。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
业内有观点认为,谷歌此次用小程序试水,不失为回归中国市场的投石问路之举。

2017年12月,谷歌宣布成立谷歌AI中国中心,整合谷歌云与谷歌中国研发团队,由斯坦福大学计算机系终身教授、斯坦福大学人工智能实验室主任、"AI 女神"李飞飞与Google Cloud研发负责人李佳领导。

谷歌AI中国中心介绍,目前Google翻译和文件极客App可在中国使用,搭载Android Wear系统的可穿戴产品在中国也非常受欢迎。

登顶攻略:注意突出特征和勾勒形状

有一定绘画基础的汤包同学在朋友圈里愤愤不平:既然已经喂了这么多数据,为什么我的小歌还是表现得像个智障?

汤包画的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
系统认可的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
汤包笔下的眼镜是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
而实际上想要被AI识别出,只需要画两个圆圈:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
小S(化名)为了画出“动物迁徙”,费劲巴拉地画了两只行进中的斑马,但实际上,她只需要画两只大雁——也就是两条折线就好。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
“这可能是因为它之前训练的数据集以简笔画为主,复杂的反而不认识。”旷视科技研究人员认为,小歌出现的这个bug 还是跟数据集有关,“它现在还不够聪明。”

那么,怎么才能让小歌更容易地识别出你的涂鸦?

一个诀窍是抓住特征。

比如画猪突出硕大的鼻孔,画蚊子突出尖尖的嘴,画蒙娜丽莎的微笑先画个画框。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
第二个诀窍是先勾勒形状,画脸先画圆圈,画微波炉先画个正方形,小歌多猜几次总能猜对。

当然,反推下来,如果你想为难一下小歌,大可以颠倒以往的下笔顺序,画图时先画细节,这样无论你画得有多像,小歌都有很大概率识别不出。


上一篇:为什么我要费尽心思造出一个不完美的绘画机器人?
下一篇:中国AI企业融资总额占全球70% 巨大的繁荣背后到底隐藏了什么
精选推荐
研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

南加州大学机器人学家:机器人更适合粗暴的爱
南加州大学机器人学家:机器人更适合粗暴的爱

[2019-11-07]  图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱,当人类粗暴的将物体从机器人手中敲掉,看似残忍,实际上却能帮助机器人找到最好的握持物 ...

改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味
九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味

[2019-11-09]  本周,在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上,一群由人工智能驱动的机器人就是这场比赛的 ...

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

本周栏目热点

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

[1970-01-01]    从首尔清潭洞SM娱乐公司大楼代表办公室的落地窗可以清晰地眺望对面的汉江。李秀满会长介绍拥有代表办公室和录音室的建筑物是工作室中心 ...

[1970-01-01]    虽然我国经济增速下降,通缩若隐若现,但由于我国劳动力人口在2012年已经达到顶峰,之后总量呈逐年下降之势,所以即使近几年产业工人工 ...

腾讯思享会:探讨智能社会与人类未来

[1970-01-01]    人类在享受开车的过程时,在不久的将来可能让机器开车,人类如不是理性的控制机器人,又将一场持久的大战。  以智能社会与人类未来为 ...

[1970-01-01]    机器人发展到今天到了重新定义的时候,机器人拥有人类的感知和思维、应用到更多领域,成为现代机器人产业发展的新方向,由此看出中国机 ...