AI系统经过近70年的发展积累了浩如烟海的知识和成果,得到了广泛的应用。其中专家系统是人工智能领域中发展最为迅速、应用最为广泛的一个技术方向。将社会专家的专业领域知识进行了充分的整理和浓缩,使专家系统成为人工智能在产品实际应用中最具实用价值的人工智能技术之一。有一名科学家,算机图像识别,是人工智能领域至关重要的技术,也是AI界无人不晓的名字。对这个行业有独特的见解,他一直坚持着AI的发展从未放弃梦想,她要打造一个怎么样的AI帝国呢?
这位科学家名叫李飞飞,1976年出生于北京,长在四川,16岁随父母移居美国新泽西州。2009年加入斯坦福大学任助理教授,并于2012年担任副教授(终生教授),和斯坦福人工智能实验室与视觉实验室主任直至今日。她入选“世界百大思想者”,被评为美国“年度杰出移民”之一(爱因斯坦、基辛格也曾获此殊荣)她是站在金字塔顶端的科学家之一。她36岁就成为斯坦福大学终身教授,任斯坦福人工智能实验室和视觉实验室的主任。她倡导的 ImageNet 竞赛,每年都牵动着整个业界的心弦。她的高质量论文,在顶级期刊发表超过100篇,被引用高达4万余次。
不久前,谷歌公布未来人工智能新布局,整合之前零散分布并各自独立于云计算业务部的各个
机器学习团队,成立了新组织,并任命一位华人女性为新组织的首席科学家。消息一出,令业界震惊又兴奋。
李飞飞如今光鲜亮丽的背后更重要的是她对梦想的持着,以坚持。不忘最初的梦想坚持的成果。我也始终相信背后他所付出的辛酸和牺牲。
李飞飞有一段不平凡的早年人生经历。她1976年出生于北京一户普通家庭,父母起的名字也极其普通:“飞飞”。 李飞飞出生后不久,一家人就搬到了四川成都。
当时生活条件不高,成都远没有今天繁华。但飞飞父母特别保护孩子的求知欲和好奇心,只要成都有展览就带飞飞去,尽可能扩大她的眼界,接触更大的世界、更新奇的事物。同时家里还有一条很有趣的家规:飞飞放学回家后只能在40分钟内做作业,40分钟后就可以看课外书、可以玩,干啥都可以,但就是不能再做作业。父母此举就是为飞飞养成专注高效的习惯,做事不拖延不左顾右盼,然后为自己留出充足时间,做自己感兴趣的事。
有了浓厚兴趣和好习惯的保障,飞飞从小学习就不错,后来考进四川重点中学成都七中(今为成都中学,全国四所国家级示范高中之一)。
进入成都七中前途似乎就一片光明,然而这时李飞飞的命运却迎来了重大转折。为了梦想,她父亲决定到美国打拼,后来母亲带她也去了美国。当时李飞飞仅16岁,陡然间进入一个语言、文化完全迥异的环境,如何适应生存下去,成为李飞飞面临的最大障碍。
另一大障碍,就是没有钱。李飞飞父母虽然都受过高等教育,但英语关过不了,无法从事类似于国内的好工作。迫于生计,父亲成了照相机修理工,母亲成了超市收银员,勉强维持温饱。因此除了上学,她还要尽可能补贴家用,课余时间去中餐馆、洗衣店打零工,去别人家打扫房子。打工和上学就成了她适应美国新生活的全部内容,最辛苦时一天睡不到4小时。
精英学霸,执着梦想但在生活学习的重压下,李飞飞从没屈服。也得益于幼年养成的好习惯,不到3年时间,在1995年高中毕业时,李飞飞已经从听不懂英语的移民“差生”,跃升至成绩前5%、排名第6的优秀毕业生,而且她还以最高荣誉拿到了世界名校普林斯顿大学的录取通知书,并且获得普林斯顿提供的全额奖学金。这个优异成绩连当地人都很难达到,为此当地报纸专门采访报道了她。
1999年,李飞飞以优异成绩获得普林斯顿大学物理专业学士学位。当时美国就业形势大好,华尔街正是牛市,而她获得了华尔街的青睐,甚至高盛直接给出数十万美元年薪录取她。但是面对高薪又体面的工作,她却选择回环境恶劣的中国西藏,去研究自己一直怀着浓厚兴趣的藏医药。这个决定疯狂又令人费解,但她得到父母支持,因为父母当初来美国就是为了实现梦想。
这个决定与她一贯以来的兴趣、好奇心、求知欲有关。李飞飞从小好奇心很强,喜欢探求真理,对问题追本溯源,比如宇宙的起源、生命的意义。她渴望拥有这种智慧,梦想通过学术研究造福人类,通过科技改变世界。虽然本科学物理,但她对藏医药的浓厚兴趣不减,希望能从科学、哲学层面,来研究此神秘领域。
于是接下来整整一年她都呆在西藏,克服高原寒区各种困难,毫无怨言,愉快地融入当地生活医疗,进行藏医药研究。这段经历对李飞飞影响很大,长久以来,西方的科学方法论和哲学思维占据学术界的主导地位,而以藏医药为切入点(之一),她体会到整个人类思想宝库中完全不同的另一面,对于突破西方哲学、科学的方法论大有裨益。
研究冷门,依旧梦想从西藏回来后,李飞飞没有进入职场,而是选择攻读研究生。在父母支持和自己辛勤努力下,李飞飞拿到了加州理工学院电子工程专业的博士学位,具体研究方向是人工智能和计算神经科学。这绝对是一把炙手可热的金钥匙,当时无数人趋之若鹜的咨询公司麦肯锡也向她抛出了入职的橄榄枝。
然而这一次李飞飞又拒绝了,转而选择进高校任教做研究,坚守自己以学术研究造福世界的梦想,不为金钱不为地位,也不为环境所迫。不仅如此,在高校工作时她再一次做了“惊人”决定——专攻计算机图像识别技术。这是当时的冷门研究,冷门到其他教授看不到结果,认为拿不到终身教授,都不愿与之合作。
通俗地说,计算机图像识别就是让计算机认出任意一张图片里包含的内容。比如让计算机认猫,那么首先告诉计算机,猫是圆脸、胖身子、两只尖耳朵和一条长尾巴构成的东西。然而现实生活中,单单猫的品种就有成千上万,就算同一只猫,也可能摆出上百种不同姿势。如果遇到一些骨骼清奇的猫,换个姿势可能计算机就傻眼了。当时,图像识别技术已发展了20个年头,但计算机能够识别的物体也不过十几种。大千世界何其多样,区区这几种物品远远不够。
坚守不懈,成就梦想面对图像识别如此匮乏的“词汇量”,李飞飞却有疯狂的想法。她不仅毫不退缩,还“异想天开”拿出字典,要让图像识别涵盖到字典里每一个词条!
最终确定的方法很原始也很简单,就是像人类婴儿识别猫那样。人类的眼睛就像一架生物照相机,每200毫秒就能获取一幅图片。婴儿从未被灌输猫的特征,却能很快认出猫,无论什么品种什么姿势。
因此李飞飞开始训练计算机,让它看更多图片。2007年起她在网上下载了近10亿幅图片,然后给它们分类、打标签,建立题库为计算机看图训练而用。由于工作量太大,几个月后研究经费几乎用光,而且照此进度需十几年才能完成建立题库的目标。在最困难时,李飞飞想过重操旧业开干洗店筹集经费,但从未想过放弃。
当大家一筹莫展时,美国最大电商亚马逊的众包平台帮了大忙。通过众包平台,李飞飞在网上雇佣了167个国家共计5万人,给10亿张图片筛选、排序、打标签。2009年时题库就包含了1500万张图片,涵盖2万多种物品。最后,这个题库发展成今天大名鼎鼎的ImageNet数据库。
更可贵的是,ImageNet如此庞大的图片数据是免费的。它向全球开放,所有致力于计算机视觉识别技术的团队,都能从它里面直接拿“试题”,训练自家识别技术的准确率。如今计算机识别的错误率已经从28%降到3.6%,比人眼识别错误率5.1%还要低。这都要归功于ImageNet数据库以及李飞飞团队的努力。
梦想点亮未来
计算机的图像识别目前还只是用于识别衣服
品牌和人脸,只能给人类一点辅助性帮助,而未来计算机将学会如何理解图片,即自行学习,能像真正的人类一样去看待世界。所有这些AI研究,都是为了最终服务于人类,就需要学术和产业有效结合。为拉近AI研究与人类日常生活的距离,也为了使AI更接地气,或许就是因此李飞飞走出实验室加入了谷歌。
现在,这位图像识别领域的领军人、
人工智能顶峰的科学家、美貌与智慧并存的华裔奇女子,执掌了世界上最负盛名的谷歌AI产业,她会带来什么样的AI前景,又会把人类带到什么样的未知领域?我们翘首以待吧;期待计算机将赋予视觉智能,为后世子孙创造更美好的未来。