爱吧机器人网 » 技术 > 大数据 > 正文

如何辨别“伪大数据”产品?

科技 营销紧跟正在上升的有力潮流来盈利,这是个长期公认的做法。在 互联网 热潮(.com boom)时期,和 互联网 一点儿关系没有的公司都在名字里加上了“.com”。环保产品满身绿色。云端产品都和“云”贴边。现在又兴起用 大数据 来贴金。

这些夸张的手段是否弊大于利呢?也许因为营销中利用了“ 大数据 ”这个词,人们能去接触并了解一个不然他们不会去考虑的产品。但这个伎俩几乎骗不了谁,并且会让用伪 大数据 技术的用户抓狂。

大数据 分析平台厂商Platfora引起了Luth Research调查 大数据 分析市场现状的兴趣。他们的调查问卷直接问回答者他们是否把小数据产品换了个包装说成是 大数据 产品;55%回答了是。大约一半的回答者称他们不得不把 大数据 分成小份来分析,并且小数据产品用在 大数据 上是不太成功的。Luth Research分析结论是:“不好用的 大数据 分析工具影响士气。对他们用的工具不满意的回答者更倾向于用压力大、令人沮丧、浪费时间这种词来形容他们的 大数据 分析体验。”

Platfora的创始人兼CEO Ben Werther说,如果一个公司把它本质不是 大数据 的产品定位成 大数据 ,那就是在自砸招牌。“今年早些时候,我为DataRPM写了些东西,DataRPM有非常好的产品,但自从我认识他们起,我就告诉他们, 大数据 不是描述他们的产品价值的正确用词。在最近的广告上我看见DataRPM用“ 大数据 公司”来描述他们自己。”

DataRPM通过 自然语言 ,自动创建面板及对数据进行语义建模来解决顶层漏斗形商业智能问题(“为何顶层漏斗形商业智能会引领新潮流”)。没受过训练的用户也可以尝试通过用 自然语言 问问题在DataRPM上试水。根据问题会生成新的面板。通过增加更多的语言,这个面板可以被细化。这样一来,用户可以找到他们并不知道的数据集。一般公司中,只有30%人接触到商业智能,通过利用DataRPM这样的产品,可以极大地提高这一比例。

但是这个和 大数据 有啥关系呢?也许勉强可以说DataRPM能从 大数据 库中进行查询吧。但是通过表单也可以做呀。表单是 大数据 技术么?一摞纸是 大数据 技术么?DataRPM为了和 大数据 贴边的做法反而掩盖了它真正的价值。

Qlik和Tableau和 大数据 公司都有很多合作并且经常被用来处理 大数据 ,但是他们的市场营销都看重他们的核心价值即辅助数据的探索和发现过程。Looker是这个领域的新秀,他们独特的探索发现方法已经有了一些活跃的初期用户,但是他们非要在产品介绍页面上写上一段他们的产品能“解开大型数据集的迷”。

说到底, 大数据 到底是啥意思呢?

Luth Research的报告验证了Werther的观点。回答者被问到了有关下面这些能力的问题:指定小时数/天数内的结果;不使用IT技术来添加数据源;迭代分析;获取数据源访问;不需要把数据分成小块;分享结果的简易程度;不使用IT来做分析;数据放在集中式数据库内;处理任何数量级的数据;自动实时的分析;能方便地加入新数据集;可视化的结论;分析不同种类的数据。

超过半数的 大数据 分析产品用户称他们有上述所有的能力。计划使用 大数据 产品的用户中有四分之一有上述的能力。注意上面和 大数据 有严密关联的只有几项而已——大多数不过是更好的商业智能技术罢了。

那么伪 大数据 技术究竟是什么呢?是并不能把大的数据集广泛让人们使用或不能帮助数据科学家有新突破的技术。就DataRPM来说,他们的技术也许是很不错的,但它并不是 大数据 技术。

那什么是真的 大数据 技术呢?是超赞的能够让人更容易地有意义地使用 大数据 。换句话说, 大数据 就是说一个东西很好并且能处理大量的数据。想要分辨真假 大数据 技术的话,当一个零售商向你推销他们的故事的时候,你可以问他这个技术是否能帮你爸妈使用 大数据 ,或者数据科学家是否能用它来做以前做不到的事。如果两样它都可以,那才可以被称作 大数据 技术。如果不能,但你认为该技术也不错,那就只能管它叫商业智能。


上一篇:十个有趣的“大数据”经典数据挖掘案例
下一篇:外媒评出2014年20大数据可视化工具及资料
精选推荐
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

本周栏目热点

[1970-01-01]   这可能是未来最具发展潜力的职业之一,我们从职场角度为你解读如何成为 大数据 工程师,以及它的职业发展 ...

从Facebook社交媒体情绪实验看大数据道德困境

[1970-01-01]   今年曝光的Facebook私自进行社交媒体用户情绪实验的新闻引起了不小的争议,这把很多数据实验卷入到社会 ...

大数据时代的美国隐私权保护制度

[1970-01-01]   2014年5月,美国总统执行办公室(Executive Office of the President)发布2014年全球大数据白皮书 ...

那些年,曾经被我们误读的大数据

[1970-01-01]   如今,业界和学术界一直在热议大数据,不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然 ...

未来农业将在田里处理大数据

[1970-01-01]   基普·汤姆(Kip Tom)是第7代家庭农场主,他的农场种植的主要农作物是玉米和大豆,他同时也在进行玉 ...