爱吧机器人网 » 专题 > 观点 > 正文

和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

谷歌方面强调,不会在这款小程序内收集任何与用户隐私相关的数据。

本文共计2670字,阅读时间4分钟。

本文为寻找中国创客(ID:xjbmaker)原创

记者 / 蔡浩爽

编辑 / 魏佳

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
谷歌一定是全球最会做营销的人工智能公司,没有之一。

2016年,谷歌阿尔法狗与人类顶级棋手对弈,让全人类意识到人工智能时代的到来;2018 Google I/O开发者大会上,Google Assistant像真人助理一样通过电话完成预约理发服务,宣告人工智能距离“成精”又近一步;今天,谷歌的你画我猜小程序“猜画小歌”刷屏朋友圈,让普罗大众都有“调戏”人工智能的机会。

“AI没有你想象中的那么神奇,可以上天入地干掉人类;也没有你想象中的那么智障,还是可以做一些传统代码做不到的事情的。”谷歌的猜画小歌研发团队人员如此解释上线这一小程序的目的。

猜画小歌炸出了朋友圈一票灵魂画手,其不按套路出牌的识别能力让人又爱又恨:猜画小歌有时候很懂你,画一笔就知道你要画什么;有时候又着实智障,明明画得很具体了,它却用机械音嘲弄你:“你画的啥玩意。”有绘画功底的画手往往难以通关,抽象派的灵魂画手反而能被识别。网友忍不住质疑:这 AI 怕不是个傻子吧?

猜画小歌背后使用了哪些技术?这一技术未来可以应用在哪些领域?谷歌AI团队就这些问题接受了寻找中国创客(ID:xjbmaker)的采访。

猜画原理

技术不难,难的是数据库

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
我们先简单介绍一下这款小程序游戏的玩法:系统给出一个需要画的词语,通常是名词,在20秒的时间内,用户画AI猜,猜中即可进入下一轮。AI从你画第一笔就开始猜,常常在你画出某些特征后就给出答案。如果猜不中,AI还会用机械音嘲笑:你画的啥玩意。

据开发人员介绍,这款小程序最初只是团队hackathon的小想法,因为大家觉得有趣,才发展成了完整的项目。

所谓hackathon,中文一般称为黑客马拉松或者编程马拉松,是科技公司激发创意的一个小比拼。常见的做法是公司内程序员、设计师以及产品人员组成小队,在一到两天的时间内紧密配合,完成一个主题下的产品或者解决方案。

2016年以来,微信小程序因为已经封装了很多组件、提供了很多接口,开发相对简单、快速,成为了很多互联网公司首选的hackathon主题。猜画小歌就是在这样的环境中诞生的。

Google AI工作人员告诉寻找中国创客(ID:xjbmaker),猜画小歌由来自Google AI的神经网络驱动。该网络源自全世界最大的、囊括超过5000万个手绘素描的数据群。

2016年,谷歌曾推出网页版你画我猜——quick,draw!一经上线就风靡全球,通过该游戏手机到的手绘数据集也被谷歌开源,为需要神经网络训练的研发人员提供样本。quick,draw!使用了David Ha与Douglas Eck研究的名为“sketch-rnn”的生成式RNN,旨在训练机器如何像人类一样提炼事物的抽象概念。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
至于这次猜画小歌具体使用的是神经网络技术中的卷积神经网络技术(CNN)还是递归神经网络技术(RNN),谷歌方面表示:无法分享关于神经网络架构的相关信息。

“其实用CNN或RNN只不过是个选择题,这两种神经网络各有长处,但归根结底都是DeepLearning(深度学习)的事情。” 人工智能独角兽企业旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

神经网络是深度学习的基础,最初是受生物神经系统的启发,为了模拟生物神经系统而出现的。通俗点说,AI 通过神经网络认知世界的过程,与婴儿最初认知世界的过程颇有点异曲同工的意思。

包括旷视研究院在内的人工智能公司所研究的人脸识别、视频结构化等技术,均绕不开CNN或RNN。

但抛开这些拗口的技术名词,这款手绘识别游戏的技术并不难。早在去年,就有一名在校生帮一个公司做过一个几乎差不多的手绘识别模型,收取的酬劳仅有一万元。相比于算法,数据集在这里显然更值钱。

回想一下,我们人类会通过识图卡片、绘画等来培养孩子识别周遭事物的能力,这些图画并不一定像照片一样逼真,但包含了事物的显性特征,传递出了人们如何重现与重构身边事物的方法。比如猫有三根胡须、汽车有四个轮子、人脸有两只眼睛一个鼻子一张嘴、金毛是有金色毛发的温顺狗狗等。“AI 对简笔画的理解也是基于数据库的训练。”旷视科技研究人员告诉寻找中国创客(ID:xjbmaker)

利用神经网络技术,通过对大量涂鸦样本的学习,猜画小歌总结出不同事物的特征点。除了特征点,数据训练也可以给AI动态的画图过程,让AI理解人类在画某一事物时通常选择第一笔先画什么、如何走笔、合适停笔。这也解释了为何有时在你画第一笔时,小歌就能给出答案。

数据库规模越庞大,结果准确率越高。谷歌研发人员表示,为了让AI能够猜出大家的画作,已经提前喂了大量的数据给模型。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略

答“阴谋论”:不会收集用户隐私数据



虽然朋友圈的灵魂画手们玩得不亦乐乎,但依然有不少网友对人工智能保持着高度警惕:“感觉这个小程序有大阴谋啊,这要是都识别了,数据收集起来,谷歌不得了了,机器人可以识别所有东西了。”

还有人担心自己不知不觉成为谷歌的免费训练师,用自己的画作丰富了谷歌的涂鸦数据集。

研发人员回应:这其实是大家想多了。“大家的画作,除非能达到一定的量级,不然是不会对AI本身产生重大的影响的。”

谷歌方面也对寻找中国创客(ID:xjbmaker)强调,不会在这款小程序内收集任何与用户隐私相关的数据。

谷歌方面也对寻找中国创客强调,不会在这款小程序内收集任何与用户隐私相关的数据。

但其实,谷歌并未正面回应是否会将用户涂鸦用于丰富手绘数据库。旷视科技研究人员认为,用小程序上的涂鸦来丰富数据库是必然的。

而旷视研究人员则认为,用小程序上的涂鸦来丰富数据库是必然的。

在应用前景方面,鉴于该数据集可以训练机器提炼事物的抽象概念、学习动态画图过程,这就为这一技术创造了一个前景可观的应用方向:帮助艺术家迸发艺术灵感、教授学生绘画的基本技巧。

除了锻炼AI 能力,猜画小歌收集的数据或许也可以有其他用武之地,比如分析一下为什么大多数人画钟表都是在3点钟。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
业内有观点认为,谷歌此次用小程序试水,不失为回归中国市场的投石问路之举。

2017年12月,谷歌宣布成立谷歌AI中国中心,整合谷歌云与谷歌中国研发团队,由斯坦福大学计算机系终身教授、斯坦福大学人工智能实验室主任、"AI 女神"李飞飞与Google Cloud研发负责人李佳领导。

谷歌AI中国中心介绍,目前Google翻译和文件极客App可在中国使用,搭载Android Wear系统的可穿戴产品在中国也非常受欢迎。

登顶攻略:注意突出特征和勾勒形状

有一定绘画基础的汤包同学在朋友圈里愤愤不平:既然已经喂了这么多数据,为什么我的小歌还是表现得像个智障?

汤包画的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
系统认可的鱼是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
汤包笔下的眼镜是这样的:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
而实际上想要被AI识别出,只需要画两个圆圈:

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
小S(化名)为了画出“动物迁徙”,费劲巴拉地画了两只行进中的斑马,但实际上,她只需要画两只大雁——也就是两条折线就好。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
“这可能是因为它之前训练的数据集以简笔画为主,复杂的反而不认识。”旷视科技研究人员认为,小歌出现的这个bug 还是跟数据集有关,“它现在还不够聪明。”

那么,怎么才能让小歌更容易地识别出你的涂鸦?

一个诀窍是抓住特征。

比如画猪突出硕大的鼻孔,画蚊子突出尖尖的嘴,画蒙娜丽莎的微笑先画个画框。

独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
独家|和“猜画小歌”研发团队聊了聊,我们总结出一份登顶攻略
第二个诀窍是先勾勒形状,画脸先画圆圈,画微波炉先画个正方形,小歌多猜几次总能猜对。

当然,反推下来,如果你想为难一下小歌,大可以颠倒以往的下笔顺序,画图时先画细节,这样无论你画得有多像,小歌都有很大概率识别不出。


上一篇:为什么我要费尽心思造出一个不完美的绘画机器人?
下一篇:中国AI企业融资总额占全球70% 巨大的繁荣背后到底隐藏了什么
精选推荐
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

全自动膝关节置换手术机器人被美国FDA批准上市
全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14]  美国Think Surgical公司已获得美国食品和药物管理局(FDA)的批准,在美国销售用于全膝关节置换(TKA)的TSolution One®全膝关节应用 ...

本周栏目热点

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

[1970-01-01]    从首尔清潭洞SM娱乐公司大楼代表办公室的落地窗可以清晰地眺望对面的汉江。李秀满会长介绍拥有代表办公室和录音室的建筑物是工作室中心 ...

[1970-01-01]    虽然我国经济增速下降,通缩若隐若现,但由于我国劳动力人口在2012年已经达到顶峰,之后总量呈逐年下降之势,所以即使近几年产业工人工 ...

腾讯思享会:探讨智能社会与人类未来

[1970-01-01]    人类在享受开车的过程时,在不久的将来可能让机器开车,人类如不是理性的控制机器人,又将一场持久的大战。  以智能社会与人类未来为 ...

[1970-01-01]    机器人发展到今天到了重新定义的时候,机器人拥有人类的感知和思维、应用到更多领域,成为现代机器人产业发展的新方向,由此看出中国机 ...