1997年免试进入北京大学就读,毕业后赴英国牛津大学攻读物理学博士。三年后获得博士学位,并留校工作。2006年赴美国国家标准局联合实验室做博士后;从2007年到2009年在加州大学伯克利分校从事研究工作;2009年被聘为中国科学院百人计划研究员正教授,其研究领域涉及激光冷却量子气体、量子信息技术和精密气体探测装置。中国载人空间站天宫(X-1)号货运飞船冷原子平台首席科学家。他曾师从诺贝尔物理学奖得主威廉·菲利普斯,2009年回国展开科研并创业。
首先我申明,我不是做人工智能的出身,我做物理的出身,也还在做物理,只是从Common Sense 来看人工智能问题。做物理的说搞数学的是人文科学,因为自然科学的基本原则是实验来检验真理,废话少说,做实验给你看。数学不是不重要,只是数学是逻辑,是研究自然科学的工具。基于有限的假设,这么说OK,那么说也OK,要能在某一个领域里得到
应用
才有意义。同样某一个物理理论能在某一个实验里得到证实才重要,物理是实证的自然科学,因为它可以被证伪。就像我现在看投资项目,想法是最不值钱的,你一旦能在市场里证明盈利能力,估值会完全不同。
回到正题,物理出身,我看问题会更加基础,不会为人云亦云的说法鼓噪,这也符合我一贯烧冷灶的习惯。关于人工智能,回看历史至少引起过人类社会三次恐慌。
第一次是在图灵的年代,美国大片这是个好东西。《模仿游戏》可以去看看。这次恐慌源于计算机的诞生,人们传统认为不可破译的密码,被计算机搞定了。这个趋势发展下去,是不是迟早有一天计算机就可以超过人类?八十年代以后个人电脑的普及带来了又一次恐慌。美国
电影
《机械战警》、《终结者》都是这个时期的代表。接下来就是这次了,又有《超能陆战队》、《Her》代表这一阶段。
前一阵子遇到一个自封”人工智能狂热粉“的投资人,号称从互联网时代就创业投资做高科技,说起来哪个方向都能整几句的主儿。我调侃的问他,为什么人工去年开始又火了。他说,硬件便宜了所以火了。我,呵呵,这么说,硬件总符合摩尔定律,那为啥不是十年前,不是五年前,不是五年后,不是十年后,差那几块钱吗?这一次,我认为更多是因为谷歌和Facebook”应用了“我党提出的互联网+的概念,把云端接入,相当于
机器人
前端有了一个强大计算能力的后端。于是有了软件机器人和云端的人工智能。当然,这个也能叫深度学习的策动。
这一次也许不过是前两次的重复。
我们直奔主题,简短洁说下面是我觉得大可不必忧心忡忡世界末日的几个
观点。
一,哥德尔不完备定律
1931年的时候哥德尔提出了哥德尔不完备证明。哥德尔证明我们以图灵机的方式是制造不出超过人类的计算机的。
哥德尔不完备性定理:任意一个包含一阶谓词逻辑与初等数论的形式系统,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理如果系统S含有初等数论,当S无矛盾时,它的无矛盾性不可能在系统内证明。从数学逻辑的基础上否定了计算机超过人类。
比如“这句话是错的”,这句话到底是对的还是错的?图灵机是没法说明它是对的还是错的。这就给图灵机开了个后门。这是哥德尔证明的简版。这问题1931年被提出来,图灵机一直没能解决这个问题。现在做线性系统的解决不了这个问题,人类会不断地去用更高维度的东西来解释低维度的东西,你总会在你的体系之外找到你这个体系的漏洞,没法做出一个完全完备的系统。
二,钱德拉塞卡极限证明
另外一个证明就是我最近提出来的所谓Chandrasekhar钱德拉塞卡证明。这个证明并不复杂,买杯啤酒用托盘纸的背面就能演算证明。如果我们认为人类的思维是线性的话,即我们现在计算机的图灵模式,那么我们现在做的计算机接入互联网之后,大概六十万台计算机的计算单元已经与一个人的大脑可比,这也是现在大家炒的深度学习的
人工智能的基础。但是我们现在还没有看到互联网这样大规模的互联网有产生像人一样有学习行为。那说明在一定程度上人的思维模式可能不是线性的,不是像计算机这样的图灵机模式。
那么在物理上存在两种信息模式,一种是所谓经典模式,一种是量子模式。我们的思维有没有可能是量子模式呢?量子本身讲的是关联的事情。用量子模式考虑人的大脑: 大脑到底有多复杂?假设每个脑细胞跟6个脑细胞发生关联,这个关联的数量是多大呢?我用一个经典的存储单元来记录这个关联,先不管它这个关联是怎样工作的,有一个关联你至少需要一个单元来记录这个关联。假设我们可以用一个经典的存储单元就能记录一个这样的关联。我们知道经典计算机,它的存储模式是“热投票”。一个磁体计算单元,它存的到底是0还是1呢?去看这个磁畴的时候,我会看到比方说每个磁畴里面会有一万个小的磁畴,小的磁畴就是小的指南针了,当小的指南针有超过百分之五十的指北的时候我会认为这个磁畴存的是1,当超过百分之五十指向南时,我们认为它存的是0。计算机的存储单元都是这样做的。根据大量的热的平均的行为统计来确定这个单元存的是1或者是0。那么热投票最少需要三个粒子,才能投出大多数来。物理实现上,一个记忆单元我们只选三个电子来构造一个经典的记忆单元,比电子轻的光子是没有意义的,它不能用来做记忆单元。
好,我们计算一下这个数量:130亿的脑细胞,每个脑细胞允许跟6个别的脑细胞发生关联,然后每个关联用3个电子来记忆和存储。这是多大的数字呢?130亿的6次方再乘以3。每个电子都是有质量的,质量是不能忽略的。再把电子质量乘进去,那么这个质量等于多大个数字呢?它等于钱德拉塞卡极限。
钱德拉塞卡极限是什么呢?在1938年,钱德拉塞卡提出来:当一个恒星的质量超过钱德拉塞卡极限时,这个恒星则会自动坍缩成一个黑洞。你明白了吗?这说明如果真的用一个经典的存储计算机去模拟一个人的大脑行为,当这个计算机还没做出来,其本身的质量已经把自己压成一个黑洞了。
这也就给出一个旁证,人的大脑行为不是人类用现在地球上的资源能做出来的。钱德拉塞卡极限这个值大约是1.4倍太阳质量。这里取6作为脑细胞可能产生的关联数,事实上每个神经元有可能跟另外1000个神经元发生关联,6这个数字只是在凑钱德拉塞卡极限。这就是说即使我们可以用最轻的单元----电子去做存储,都没有办法去构建一个够大的系统描述一个人的大脑关联行为。从这个角度想,用经典的图灵机办法做出一个超过人脑的计算机这事情是不太可能的。