1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌?
如果你拥有这样的技能集,那你就有可能当上数据科学家。而如果你当上了数据科学家,那你的日子就可以过得风风光光了——LinkedIn的最新投票结果显示,“统计分析和数据挖掘” 是2014年最大的求职法宝。
美国招聘网站Glassdoor的报告称,数据科学家的平均年薪为118709美元(约合人民币737550元),而程序员的平均年薪为64537美元(约合人民币400974元)。麦肯锡公司的一份研究预测称,到2018年,在“具有深入分析能力的人才”方面,美国可能面临着14万到19万的缺口,而“可以利用大数据分析来做出有效决策的经理和分析师” 缺口则会达到150万。
该领域目前异常火爆,纽约大学数据科学中心课程的负责人罗伊-洛伦斯(Roy Lowrance)表示,现在可能已经到了巅峰期。“也许存在着泡沫,” 他说。 “无论什么事情,一旦变得这样火爆,之后就肯定就会冷下来。”不过,纽约大学希望在未来几年里扩大数据科学课程的招生规模,把学生人数从40名增加到60名。本学年还有五个月才会结束,但50%到75%的学生已经找到了比较理想的工作。
为什么该领域会变得如此火爆?琳达-博奇(Linda Burtch)是芝加哥的猎头公司博奇工程的董事总经理,她表示,尽管像谷歌、亚马逊、Netflix和Uber这样的高科技公司都有自己的数据科学团队,但那些非高科技公司,比如Neiman Marcus、沃尔玛、Clorox和Gap,它们现在也需要使用这方面的人才,“很多公司都在物色数据科学家,”她说。
这些公司希望,数据科学专业人才可以挖掘新的信息,来帮助公司开源节流。IBM负责大数据业务的副总裁Anjul Bhambhri表示,航空航天制造商Pratt & Whitney现在可以预测出飞机发动机何时需要进行维护,准确率达到97%,这可以帮助它更加有效地开展业务。
虽然IBM在本月刚刚推出了基于云计算的Watson Analytics免费增值工具,但是,为了分析非结构化数据,数据科学家常常不得不亲自动手编写专门的软件程序,这正是数据科学家必须掌握编程技巧的一个原因。
学校教育
洛伦斯说,数据科学家需要具备三项基本技能:数学/统计、计算机能力、在特定业务领域的知识。纽约大学数据科学中心希望招收至少具备其中一种技能的学生,然后培养他们掌握其他技能,让学生到毕业的时候,可以独当一面负责处理数据工作。 “在学习过程中,他们要做一些数据科学项目,这些项目需要他们用到这三种技能,”他说。
但是,如果你想成为一名数据科学,也不一定非得去大学读书才行。从今年9月开始,一家名为梅蒂斯(Metis)的公司开始在纽约举办为期十二周的数据科学训练营,费用为1.4万美元。报名的人非常之多,入学竞争相当激烈。梅蒂斯公司的联合创始人杰森-莫斯(Jason Moss)说,大约有一半的学生都拥有硕士或博士学位。
第一期训练营在12月初结束。莫斯说,不过几周, 15名学生中就有6名拿到了聘用通知。
“我不认为训练营可以替代大学教育,”莫斯说。“训练营可以提供一条捷径,让你以最快的速度找到一份工作,但大学的目的不在于此。但我也不认为你必须上大学才能成为一名数据科学家,”他说。“有一种人,他们天生具有好奇心,有勇气,有决心,总想把事情理出头绪,他们在这一行可以干得很好。”
Anmol Rajpurohit是一名独立的数据科学家兼顾问,他说,做这一行工作最重要的素质就是能够快速学习东西。“与专长于任何特定编程语言相比,泛型编程技巧远远更加重要,”他说。 “在如今这个时代,技术的发展突飞猛进,语言会很快过时,新的语言则将迅速普及。因此,学东西很快的人,会比单独领域的专家更有前途。”
洛伦斯说,他认为,在某些技能方面,训练营和网上课程可以为学习者提供很大的帮助。但在另外一些方面,它们的作用就就相对有限了。纽约大学的数据科学课程有一个优势,就是可以按照正确的先后顺序来培养你的技能。“我们的教学顺序可以让你循序渐进、融会贯通地掌握技能。”他说。
数据科学家要做哪些事?
游戏公司Playstudios的数据科学家乔恩-格林伯格(Jon Greenberg)说:“在日常工作中,我需要管理一系列控制面板,它们提供的信息可以让公司知道,我们的生意到底做得怎么样? 用户在做什么事情?”格林伯格现在是一名经理了,所以他编程的时候没有以往那么多,但是他有时候仍然需要编程。通常来说,他把数据从Apache Hadoop的存储器里调取出来,在分析平台Revolution R上运行它,并对它进行一些可视化处理。 “比如说,我们可以从中得知一部分用户如何与新推出的功能互动,”他解释说。
六年前,格林伯格拿到了统计学的硕士学位。他希望进入政府部门工作,但却惊讶地发现,公司企业非常需要数据科学家。 “那个时候,数据科学领域还没有现在这么火爆,,”他说。现在,他每天都能从猎头那里收到一个电话或一封邮件。 “这种情况不只是发生在我身上,”他说。“所有的数据科学家可能都是这样。”
对于格林伯格来说,就业机会很好只是一个加分项,因为他本来就热爱这一行。 “我认为,要做数据科学工作,你必须得有分析头脑才行,而且还得有好奇心,”他说。“你必须得有灵活性和创造性,构思出不同的方法来解决问题。”这项工作的唯一缺点,格林伯格说,就是“清洁”数据(去掉那些没有相关性的结果)需要花费大量时间。“这部分任务并不是那么招人喜欢,你得花很多时间来做它。”他说。