爱吧机器人网 » 技术 > 机器学习 > 正文

数据驱动深度学习革命 谷歌说要彻底改变小企业的生意方式

\

最近几年,深度学习已经成为越来越热门的技术,但很少有公司能像谷歌及其母公司Alphabet那样,利用深度学习技术在如此多的领域取得巨大进展,并将其完全融入到操作业务中去。为了与谷歌推动其创新的努力保持一致,该公司在云计算大会NEXT 2017上发布了一系列与人工智能(AI)相关的公告,同时以“让人们能够在世界上最强大的深度学习系统中实现民主化”为主题。

近年来,谷歌及其姊妹公司已经成为“以疯狂速度推进AI革命”的代名词,并在整个公司的服务中引入深度学习。其中最著名的例子是,Alphabet子公司Deep Mind的AI程序AlphaGo成为了第一个击败顶级围棋选手的机器,而Waymo的无人驾驶汽车也已经成为自动驾驶革命的象征。但是,这是一场静悄悄的AI革命,它塑造了从谷歌翻译到谷歌搜索的所有东西,对谷歌本身产生了最大的影响。同时,它还带来了自动推理的力量,几乎可以影响到公司所做的每一件事情。

由于谷歌已经建立起庞大的基础设施来训练和运行这些AI系统,谷歌现在正将这些工具带给大众。有些公司已经建立了自己的AI研究部门,需要为特定的应用程序建立高度定制的模型。然而,在这样做的过程中,他们很快就遭遇了构建大型深度学习模式的艰巨硬件要求,通常需要整个加速器农场进行快速的迭代。

在谷歌的案例中,它提供了一个名为“云机器学习引擎(Cloud Machine Learning Engine)”的深度学习托管平台,负责提供深度学习开发所需的硬件,让企业可以专注于构建自己的模型,并将计算需求转移到谷歌。毕竟,很少有公司在AI领域投入如此多的资金以建立自己的自定义加速器硬件,就像谷歌的张量处理单元(TPU)那样。

当然,尽管算法和硬件的进步在AI革命中发挥了重要作用,但在没有数据的情况下,很难在这一领域取得真正的进展。目前的AI系统需要海量的数据来学习一个新概念。人类可以看到一个新物体的单一图像,并能立即识别出它,但类似的AI系统需要大量的图像从多个角度描绘这个物体,从而建立正确的内部图像。这意味着,像谷歌这样的公司能够收集到数亿张照片,从而为地理位置等应用程序构建一个可视化的地球图像,这是一个巨大的优势。

简而言之,深度学习革命是由数据驱动的,但很少有公司能像谷歌那样拥有如此多的数据。这意味着,当涉及到深度学习系统时,你很容易找到工具,但很难找到你真正可以使用的预先训练过的模型。我本人曾希望找到足够强大的系统以便对全球新闻图片进行分类。在过去的几年里,我尝试了无数的系统,我发现许多系统提供了令人不可思议的技术,但是没有任何系统能够提供丰富的预先构建的目录,它们没有成千上万的标签,也未能很好地利用来自非西方世界的图像,直到我偶然发现了谷歌的 Cloud Vision系统。

\

事实上,这是许多公司的共同需求:他们有兴趣为客户建立服务,而不是进行AI研究。随着外部化趋势的发展,谷歌已经通过发布许多内部AI系统作为公共云的API来应对这样的挑战。Cloud Vision接受任意图片,并对物体、活动以及文本分类。它能识别图片中所描述的位置、估算人脸的情感,甚至还会标记图片中是否描绘了暴力。所有这些都有API调用,结果会在几秒钟内反回馈来,而且可无限扩展。

Cloud Speech可用80多种语言进行现场演讲,不像传统的语音转录系统,它不需要任何训练。Cloud Natural Language接受英语、西班牙语和日语中的任意文本,并输出独立的解析树,识别关键实体,甚至执行情绪分析。在NEXT 2017大会上,谷歌以其最新的工具 Cloud Video Intelligence扩展了这个阵容,它将视频和短片分割成场景,并在每个场景中识别出主要的主题和活动,让人们可以获取一个庞大的视频档案,并即时编辑索引,使其可以被按照题目尽心搜索。

这些API之所以如此强大,是因为它们是作为简单的API而被公开的。你只需用你的数据做一个API调用,几秒钟后就能得到世界上顶尖AI研究人员建立的、经过预先训练过的算法给出的结果。深度学习的巨大复杂性隐藏在一个简单的API调用背后,你甚至可以将API调用串在一起,用几行代码构建难以想象的复杂工作流程。

Teowaki的贾维尔拉米雷斯(Javier Ramirez)让我们得以窥视,如何利用这些API快速构建一个完整的工作流程,只需几分钟的时间和几行代码。在他的教程中,他以英国首相特里萨梅(Theresa May)就职演讲的YouTube视频为例,并通过Cloud Speech API为其提供了一个高质量的文本文字记录。然后,他通过Cloud Natural Language来获取这些文本,以提取其中提到的重要实体(以及维基百科页面上的链接以获取更多信息),并计算出演讲的一般情绪。

只需要几行代码就可以制作几个API调用,然后用YouTube上的视频转录,并提取关键实体和情感。更令人惊讶的是,整个工作流程都可以被放大,可以在数百万个视频中运行,而无需进行任何改动。这就是云计算的力量。

就在谷歌将其服务和安全模式具体化的同时,它也为其不可思议的AI技术进步打开了大门,并为想要打造自己模型的公司提供了AI托管环境,以及不断增加的预先训练模型,这些模型允许公司通过简单的API调用来构建复杂的应用程序。

在NEXT 2017大会的几次会议中,可以清楚地看到,AI以及其在主题演讲中的大量存在表明,谷歌押注于将AI投入到企业中。最后,谷歌实际上是通过让用户容易使用来实现对世界上最先进AI算法的访问,以至于即使是最小的企业也可以利用深度学习的全部力量来彻底改变他们做生意的方式。

(英文来源/forbes,编译/机器小易,校对/小小)


上一篇:吴恩达:如果高管懂机器学习 数百万人将会失业
下一篇:张亚勤:机器学习过于复杂 人工智能应该从简
精选推荐
MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......