在昨晚的 Google Cloud Next 谷歌云计算开发者大会上,华人 AI 学界的骄傲、谷歌云首席科学家李飞飞宣布了一则重大消息:谷歌收购 Kaggle。
其实,关于这事儿,近两天陆续有风声传出。但谷歌和 Kaggle 对各路媒体总是一副 “无可奉告” 的态度,导致大家各自猜测,但无从证实。即便是李飞飞在 Next 大会上对全世界进行宣布,也仅仅停留在 “没错,我们是收购了 Kaggle,这事儿对双方都有好处” 的层面;对收购细节、未来计划等信息一概无涉,更不要提收购协议和价格。
但是,Google+Kaggle,即便不进行任何发酵,也是震动数据科学、 AI、机器学习三界(好吧,在很多方面 “三界” 本是一体)的大事件。其衍生出来的潜藏信息:对开发者社区的意义、行业走向,以及谷歌的机器学习布局等——虽然当事者惜字如金,却为嗅觉敏锐的观察者带来 巨大的想象空间。这隐约使人联想起 2014 年谷歌对 DeepMind 的收购:虽则后者与 Kaggle 不管在业务、还是运营方式上都完全不同,但 Kaggle 所掌握的行业资源,只在 DeepMind 之上;两次收购对于谷歌的意义,同样位于极高的战略层面。
李飞飞宣布谷歌云收购 Kaggle
下面我们来整理一遍,关于此次收购迄今为止披露的所有信息。
Kaggle 简介
凡是玩数据科学和机器学习的老司机,有两个网站一定不会错过:GitHub 和 Kaggle。前者用来分享,后者进行实战练习。对于不熟悉 Kaggle 的童鞋,我们先来进行一段简介。
简而言之,Kaggle 是玩数据、ML 的开发者们展示功力、扬名立万的江湖。
它在 2010 创立,专注于举办数据科学周边的线上竞赛。它吸引了大量数据科学家、机器学习开发者的参与,为各类现实中的商业难题开发基于数据的算法解决方案。竞赛的获 胜者、领先者,在收获对方公司提供的优厚报酬之外,还将引起业内科技巨头的注意,获得各路 HR 青睐,为自己的职业道路铺上红地毯。
因此,与 GitHub 不同的地方在于,Kaggle 为其社区提供了一整套服务。其中最有名的是它的招聘服务以及名为 Kaggle Kernels 的代码分享工具。
或许因为如此,Kaggle 社区在圈内极受欢迎:用户基数大、粘性强。通常认为 Kaggle 平台有几十万数据科学家。至于具体多少,有媒体认为是五十万,有人说八十万(李飞飞),还有人说超过一百万。
总而言之,Kaggle 是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。
而大约一年前,Kaggle 开始全力在 AI、机器学习领域发力,相关竞赛项目纷纷上马。李飞飞评论道:
“AI 民主化” 的使命“Kaggle 是搜寻、分析公共数据集,开发机器学习模型,和提高数据科学专业水平的最佳场所。”
在大会上,李飞飞发表了主题为 “让 AI 民主化” 的演讲。在此次演讲和之后撰写的博文里,她对谷歌收购 Kaggle 的意图给出了官方版本的解释:
“我强调 AI 民主化的重要性——我们必须降低进入 AI 领域的门槛,让 AI 技术能为尽可能多的开发者社群、用户和企业所用,让 AI 被用于解决他们各自的问题和需求。Kaggle 加入谷歌,能加速这一进程。”
冠冕一些来讲,推动 AI 技术的分享和推广,是谷歌收购 Kaggle 背后的 “mission”,即使命。
加入谷歌之后的 Kaggle
虽然谷歌对收购协议的内容进行保密,我们仍能从双方已透露的信息看出一些端倪。比如,有一件事是确定无疑的:Kaggle 将保留独立品牌和团队。
Kaggle 创始人 Anthony Goldbloom 也在昨晚发表博文,回顾 Kaggle 创立以来取得的成绩,对支持 Kaggle 社区的开发者表示感谢,并透露了一些将来的计划:
“ Kaggle 团队仍会是一个整体,并将作为谷歌云旗下的独立品牌运营。我们会继续扩展 Kaggle 上的竞赛和开源数据平台;并且我们会继续对所有的数据科学家、公司、和技术敞开怀抱。Kaggle Kernels 会继续对各类机器学习库和工具包组成的多样生态进行支持,不管其是否来自谷歌。
加入谷歌能让我们实现更多。此次收购,把世界上最大的数据科学社区与最先进的机器学习云结合到了一起。
加入谷歌后,我们能够向社区提供谷歌云技术。这将使大家能利用更强大的基础设施和部署服务(deployment services),进行可扩展的训练,并且帮助 Kaggle 拥有存储、获取大型数据集的能力。”
Anthony Goldbloom(图片与本新闻无关)
李飞飞在大会和博客上的表态,虽没有 Anthony Goldbloom 详细,但也印证了一些 Anthony Goldbloom 提到的一些要点。比如,飞飞老师说谷歌云将为 Kaggle 社区成员提供云机器学习开发环境,Kaggle 和谷歌云将继续支持训练和部署服务,并帮助社区存储、获取大型数据集。
结合飞飞老师对 “AI 民主化” 的表态,以及在大会上回溯她亲手创建的 ImageNet、对数据库重要性进行的强调;雷锋网认为,我们应当可以期待谷歌云在数据上为 Kaggle 提供强力支持,帮助 Kaggle 社区的开发者获取更多、更有价值的数据集。而这确实击中了数据科学家和机器学习开发者的一大痛点。这无疑也将直接提升谷歌对数据科学、机器学习社区的影响 力,以及在其中的口碑和品牌认同。
收购 Kaggle 之后的谷歌
谷歌的核心业务与 AI 紧密相关,也已经成为推动这一轮 AI 技术浪潮的主要玩家之一。AI、数据科学和机器学习对于谷歌的战略意义,已毋庸赘言。自从去年 AlphaGo 与李世石的世纪之战,谷歌的江湖声望更是如日中天。
但是,在 AI 应用和技术的各个垂直领域,如自动驾驶、语音识别、深度学习等,谷歌很可能已经感觉到压力。众所周知,谷歌 Waymo自 动驾驶业务并不是一帆风顺。在语音识别领域,微软和 IBM 屡创纪录。深度学习领域,Facebook AI 实验室 FAIR,以及 OpenAI 都在生成对抗网络 “GAN” 这一前沿技术上投入巨大,产出丰厚研究成果。业内人士对于谷歌在 AI 技术上 “领先” 于其它对手的印象,已经不再那么牢固(如果此前称得上 “牢固” 的话)。
想要维持 “老大哥” 地位,就要进一步投入。而有一个领域是谷歌远远甩开对手的:没错,我说的是 Tensorflow。在深度学习开源工具上,Tensorflow 的市场占有率远远超出其他任何框架、平台。因此,对于开发者这一群体,谷歌的影响力具有天然优势。而收购 Kaggle 则将这一优势无限扩大。
当然,我们不要忘记,Kaggle 加入的部门是谷歌云。与竞争对手亚马逊 AWS、微软 Asure 相比,谷歌云的地位一直十分尴尬,市场占有率远远落后于前两者。此次的 Google Cloud Next 大会,重点其实是宣传谷歌在云计算上的巨大投入和决心。而细看谷歌对于此次收购的官方表态,也不乏对谷歌云将来能为 Kaggle 所提供的各种支持的强调。谷歌或许希望 Kaggle 能成为谷歌云业务的一项突破口,比如借 Kaggle 平台让开发者体验谷歌云、为后者做宣传。至于其它具体玩法,现在不得而知,尚待将来观察。
另外,外媒纷纷猜测,收购 Kaggle 可使谷歌在雇佣尖端开发人才上获得便利。这是一个十分合情合理的推测。
周边
-
谷歌与 Kaggle 的合作已经开始
雷锋网 (公众号:雷锋网) 消息,上个月(2 月 16 日),Kaggle 与谷歌联合举办了 Google Cloud & YouTube-8M Video Understanding Challenge。这是迄今为止世界最大规模的视频理解挑战赛。该挑战要求机器学习开发者,寻找出自动标记 Youtube 视频的方法。详情请戳这里。
-
澳大利亚媒体的哀叹:“谷歌买走了我们的 Kaggle!”
雷 锋网了解到,Anthony Goldbloom 是墨尔本大学毕业生。他于 2010 年在悉尼创办 Kaggle ,但在 2011 年将公司总部迁去了旧金山,这次更是直接被美国企业收购。不出意料,对这次谷歌收购 Kaggle 报道最积极的当属澳大利亚媒体。这再次让小编联想起 DeepMind——以及它被收购后英国 AI 圈的反应。