这就叫 大数据 ,有了移动 互联网 之后, 大数据 飞速发展。有了 互联网 ,内容就变成数字化,利用移动 互联网 ,可以很快地让用户帮我们做实验。比如新一代 互联网 创新就是把一个想法先让用户体验来看用户的反馈,根据反馈确定修改的方向,再来改进。科学家、 互联网 公司、任何人都可以通过这种方法达到最优的状态。 人工智能 、 机器学习 都是这种运作的方式。我们做实验或做产品,会有一个假设,我们会收集资料、数据来验证假设。收集资料之后发现假设需要修改,或发现需要再做一个实验,或要修改实验部分的内容再循环一次。这是一种闭环反馈或者试错。现在很多电视剧,也是每天写剧本,根据观众的反应再进行修改。许多过程都是这样的循环,通过每一个循环可以慢慢进步。农业、工业也是这样。
这就造就了数据为王的时代,反馈回路越快到达,就相当于可以在相同时间里做更多的实验,也就可以取得胜利。以前很多人要一年、十年或一个世纪才能得到反馈,现在可以得到反馈很快地去改善,可以预见未来会更快。现在有一个新的称呼是数据科学家(Data Scientist),每天通过看大量数据,看用户反愧脉动等等,包括市场调查等,利用数据去解决问题。
在这个过程中,如何能够不遗漏数据,让数据为我所用,微软投入了许多心血。不仅是对 人工智能 、 机器学习 、 大数据 ,包括里面传统的数据库、系统、网络上都使用了 大数据 技术。其中,速度很重要。 大数据 的搜集是一方面,数据处理的速度如果没有,那数据就没有意义。
更深入一点是跟技术有关的。比如一个人博学多闻,意思是这个人知道很多数据、很聪明。但是另外一方面,有时他因为信息不够而难以决定,这并不代表这个人很笨。更何况许多事情牵涉到商业机密、国家机密或个人隐私,正常人是没有办法知道的。回到人工助手的问题,我的人工助手知道我喜欢坐哪班飞机、坐哪个位置,如果突然换一个人工助手可能就不知道我的偏好了,因为它还没收集到我的数据。因此我认为凭借数据量的大小来判断一个机器是否智能是值得商榷的。
讲到 人工智能 ,一般 人工智能 是做 算法 ,但是信息多了之后的确是会比较聪明。我认为未来一个大的方向,是如何通过机器和人的结合使得人类变成「超人」。因为人善于思考,但是人会忘事,计算有时也可能算错,可能看不清所有的东西,但是机器可以,机器看东西可以通过扫描,但是要用人的 算法 去提取知识。假设,我是做证券交易的,我希望看到今天所有公司与股票有关的数据。机器可以扫描比人眼看到更多的数据,但是扫描之后还是识别不出涨跌,就需要用到人类的 算法 。人类如果能够和机器结合,就可以做出最好的证券交易或推荐。这就是未来的兵家必争之地。
但是信息 安全 是未来一个很重要的问题。在这个过程中什么信息可以让什么样的人、什么样的程序看到,是一个很大的问题。因为牵涉到了国际 安全 、商业 安全 和个人隐私方面的问题,这也是将来很重要的研究方向,我们在微软的基础研究、应用研究也在开始尝试。
刚才提到人和机器互相的优势互补。你曾经提到机器是需要从功能到智能、智慧、智力,现在大部分属于智能方面。如果给人类帮助,势必要从智能进化到智力,在这个过程中有哪些难题是需要学术界和产业界去解决的?
洪小文:最困难的问题是我们对人的了解还不够,这其中还会涉及到哲学的东西。人的左脑和右脑,左脑是处理逻辑的事情,科学常常讲大胆假设、小心求证,左脑是小心求证,右脑是大胆假设,右脑就是负责语言和创造力,关键是在创造力。
计算机是最好的左脑。计算机需要人去编写程序,即 算法 ,人通过 算法 告诉计算机动作的指令。比如开根号,我们通过一个 算法 ,可以让计算机一直开根号。人也可以去开根号,但是有时候会算错。 算法 有很多重复性的东西,但是机器做重复性的事情不会出错,也不会叫累。 算法 是人制定的而不是计算机,因为基本没有证据证明,有一个程序可以使程序产生新的 算法 。
如果人类了解了创造力的产生过程,我想就有可能教会计算机,最难的就在这里。可能我们永远不会了解到,那更不要说人的意识。笛卡儿说「我思故我在」,意思是我是有意识知道做这件事情、为什么做这件事情,也知道你会怎么看我做这件事情。今天计算机都是 大数据 分析,像数学问题在不断优化自己的结果。小冰在与用户交谈的时候,可以不回答这个问题,做一些类似有情感、明知而不说的反应。但是这样做很有限,不像人类每件事情都是有意识的。甚至许多聪明的动物都还没有自我的意识。但是创造力是另一回事。今天可以让机器做选择题,基于 大数据 分析后可能选A,这个机器可以做到很好。但是人不是这样,人可以说不是A、B、C、D的任何选项,而提出一个新的选项,这就是创造力。爱因斯坦自己也很难说为什么他会想出相对论。如果这能够讲清楚,岂不是能够产生许多个爱因斯坦,这是无法实现的。很多时候我们的创造讲不清楚原由,可能与以前的经验有关,但也讲不清楚。
有趣的是人睡觉的时候是没有意识的。人之所以成为人,与机器还是有非常大的差别。机器到目前为止证明的是能成为最好的左脑,但是右脑真的不知道怎么去做,人对右脑的理解也是不够的。
我更相信人加机器变成一个超人,所以 人工智能 (AI)的A本来是Artificial,我觉得A应该变成增强(Augment)。博学广闻也是一种智慧,人不可能读所有的书,但是机器可以,通过扫描很简单的就做到了。但机器读完以后不去理解也没有意义,其中还是需要人的 算法 。如果人的 算法 能够想清楚,至少对于特定的行业,可以叫机器去读一些文章,然后反馈一些总结或是图表呈现,从而来帮助我们优化 算法 ,在此基础上再去看文章。通过这样配合,未来人类很有可能用电脑来帮助提升左脑能力,用左脑 算法 来小心求证,用右脑 算法 来大胆假设,两者同等重要。
传统理工科主要利用左脑,右脑的创造力在将来是最了不起的。右脑不仅是计算机无法取代的,而且是人类最珍贵的东西,是我们强调的创造力。当然只有大胆假设也不行,计算机的小心求证也是必要的。