爱吧机器人网 » 技术 > 机器学习 > 正文

机器学习与语义搜索 谷歌的终极武器是什么?

 

机器学习与语义搜索 谷歌的终极武器是什么?

文/机器之心

过去这几年对于搜索引擎营销者来说是激动人心的(或者说有些骇人,如果你不那么能够接受变化的话)。谷歌引入了一系列新技术和系统来优化其已非常出色的搜索算法,它的竞争者如必应,苹果,微软,甚至是Facebook也引进或升级了对应的系统来优化它们的用户搜索体验。

而这些优化的核心目标则是解决计算机与人工智能历史上最困难的问题之一:对自然语言的获取与理解。虽然机器非常擅长程序性和逻辑性的任务(如解数学方程或识别物体数据特征),但是它们难以辨析那些仅有母语使用者才能凭直觉感受到的微妙差异。举个例子,对我们来说「最近的汉堡店在哪里」和「我想吃汉堡」两句话传达了相似的意图,但是对于基本的机器而言,两者差距甚大:第一句话是对特定信息的检索,与说话者的想法无关;第二句话传达了一个明确的欲望,与信息索取无关。过去几年中,谷歌致力于打破不同语言间的隔阂并且解决其机器算法所面临的问题。但是这一努力的终极目标是什么呢:谷歌是否想要完全地理解人类思维所传达的意图和微妙语义呢?或者说这只是其技术发展中的一次探索?

机器学习与语义搜索 谷歌的终极武器是什么?

语义搜索的根源和蜂鸟算法

2013年,伴随着蜂鸟更新(Hummingbird update)的引入,语义搜索(Semantic Search)这一概念第一次进入人们的视野。此前,谷歌通过确定搜索查询语句的关键词来检索出相应的网页。就上述汉堡店的例子来说,谷歌会得到「汉堡」这个关键词,并返回频繁提到该关键词的网页——但这一方法不能真正捕捉用户的意图,它无法区分用户是想搜索「汉堡店」还是「如何自制汉堡」。尽管还需完善,基于用户意图辨析的蜂鸟算法(Hummingbird)能够捕捉到用户意图的关键因素并且「理解」页面的内容,而不再拘泥于页面所包含的关键词。

个人数字助理和语音搜索

个人数字助理,包括谷歌Now和Siri等,需要更高水准的语义理解。目前出现了一些新的障碍,包括将口头语句翻译成输入文本,找到合适的搜索方式,并且以一种可理解的方式进行回复。尽管在本质上,搜索结果的获取依然还是依靠谷歌的标准搜索算法,但人工智能算法不断改进,这些技术已经进步到了我们今天所能看到的水平。首要的动机是让搜索变得更易用,但第二个动机却是要改变用户习惯:语音搜索需要使用对话输入和上下文提示,比起传统的基于关键词的输入,这需要更加强大、更相关的结果。

RankBrain的出现

去年语义领域最大的新闻是RankBrain的出现,它是一种与蜂鸟算法相结合的机器学习算法。我概括了它的目的来对其进行简要说明:

它的作用是帮助谷歌理解用户输入的各种冗长复杂或者模棱两可的口头的查询语句。可以这样理解,它把那些不符合语法规则的糟糕输入语句翻译成可以被算法逻辑解读的形式。而且因为利用了机器学习,它能够自行更新,从而不再依赖开发者的人工调整和升级。

「相关问题」的兴起

为了让用户的搜索体验更加饱满,谷歌正在逐渐推广「丰富答案」(rich answers)(在传统的搜索结果上方时而出现的简明版「答案」)。最近,谷歌更是推出了「相关问题」,它鼓励用户就其搜索主题进一步进行探索。尤为有趣的的是,目前「相关问题」的答案与各自对应的作为Rich Answers的答案是不同的,也就意味着两者是基于谷歌搜索算法的不同区块的(比如,我们可以谷歌知识图谱(Knowledge Graph)和RankBrain)。无论如何,似乎谷歌正致力于不仅仅理解用户的查询问题,并且简洁明了的回答它们。

三大预测

为了推测出这些观察情况的意义,我想要提供三种预测,预测谷歌接下来十年会如何选择接下来的发展道路:

1.机器学习会成为新的目标。目前,机器学习仅存在于谷歌搜索算法较为优化的一部分。我猜想,它的应用将延伸至其它领域,包括网页内容质量分析(content quality analysis)和上下文反向链接评估(backlink context evaluation)。

2.谷歌将致力于把每一条搜索查询都转化为可回答问句的形式。随着丰富答案及相关问题的积累,很显然谷歌希望向用户提供最直接的信息。我想,我们将会见证谷歌在这个方向更多的努力,包括将基本的查询语句转化为复杂的、可回答的问句。

3.新涌现出的科技将会让更多人转向语音搜索,这自然意味着语义更加复杂的问句和直接回答这些问句的答案。越多的人使用语音搜索,对谷歌来说则意味着更多的数据,对用户来说则是更好的搜索结果——总的来说,我们会得到更加完善的搜索系统。因此,我猜想谷歌会推动更多人在未来的几年里使用语音搜索。

用你觉得合适的方式将这三个预测运用起来:你可以着手采用新的内容营销策略来回应用户的问题;或是使用新的技术进行搜索引擎优化(Search Engine Optimization),以避免机器学习所带来的频繁变化;再或者,你只需等待一个更加容易、更加符合直觉的搜索方式供自己使用。我们无法对未来下定论,但是回首过去短短几年我们取得的巨大进步,可以预想,接下来的十年将是极具开创性的十年。

本文选自Forbes,作者Jayson DeMers,机器之心编译出品,编译:张诗玥,柒柒。


上一篇:无法跨越的“心魔”仿真机器人研发的“恐怖谷”现象
下一篇:IBM华生超级电脑能从你写的文字中识别出情绪
精选推荐
Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

全自动膝关节置换手术机器人被美国FDA批准上市
全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14]  美国Think Surgical公司已获得美国食品和药物管理局(FDA)的批准,在美国销售用于全膝关节置换(TKA)的TSolution One®全膝关节应用 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......