整理:俞晶翔 张康
量子位 出品 | 公众号 QbitAI
5月30日周三晚,北京大学“人工智能前沿与产业趋势”第十三讲,本期北京航空航天大学博士生导师、机器人研究所名誉所长王田苗,分享了近期由机器人行业发生的变化引起的思考,以及整个机器人行业的发展和应用的相关内容。
本期内容案例与理论结合,深入浅出,量子位作为合作媒体,为大家带来详细课程笔记一份。
主讲嘉宾:王田苗,北京航空航天大学博士生导师,机器人研究所名誉所长、智能技术与机器人iTR实验室主任、国家特聘教授长江学者、国家杰出青年基金获得者、国务院学位委员会学科评议专家组成员、国防科技机器人创新团队带头人、中国电子学会嵌入式系统与机器人分会主任委员、中国自动化学会机器人专业委员会副主任、IEEE机器人与自动化学会北京地区主席。
课程导师:雷鸣,天使投资人,百度创始七剑客之一,酷我音乐创始人,北京大学信科人工智能创新中心主任,2000年获得北京大学计算机硕士学位,2005年获得斯坦福商学院MBA学位,同时也是“千人计划”特聘专家。
最近三个月的剧变
今天讲的内容分成两部分:第一个是这两三个月在机器人行业发生的一些事情,由此引起的一些思考;然后是我自己在这方面的一些研究,以及整个行业人工智能和机器人发展的动力。
今年国内的工业机器人,特别是轻型机械臂,非常火爆。
机器人有三大关键部件:减速器、电机伺服和控制器,其中减速器最重要,而且需要排队购买。
轻型的六个自由度的机械臂销售价,现在差不多两万四、两万五左右,这个数字意味着,如果这个机器人能够完成相应的搬运焊接,它就能顶两个人的工作量,也就是当年就能收回投资成本。
这样就造成了中国机器人目前以25%的速度在增长,已经连续了三年。目前世界上40%的机器人都应用在中国。这样的发展会让人有一种感觉:企业都有机器,有无人化车间的可能。
另外亚马逊正式宣布由前苹果高管,来组织一个家用机器人的开发。其中第一个研发项目是交流会话,第二个是识别,第三个是能够接一些快件,甚至将来还可以陪护或者交流。
这个信息在业界还是很震动。因为在很多互联网公司里,只有亚马逊有硬件的基因。十年以前亚马逊的电子书就拿下了60%全球的市场。
六年前,亚马逊创造性地做了电商,然后收购物流配送;四年前,亚马逊将人工智能和音箱、音乐结合起来,出了智能音箱叫Echo,在世界上爆卖。谷歌在2016年的时候也推出了音响,但是远远落后于亚马逊。
所以当亚马逊推出这个机器人的时候,人们突然感觉它也在革自己的命。因为这台机器人的推出意味着,音箱的功能将会全部集成到这上面,产品将会换代。
这个月25号的时候,欧盟的一版数据保护法引起了很大的轰动,其中最重要的一个规则就是:将来每个客户的数据的更改保存和使用都要经过个人的认可。这个事情对谷歌、Facebook等公司都将提出非常严厉的考验,包括在医学上。
最近还有沃森,本来在人们心目中他是一个有代表性的做人工智能的医疗诊断方案助手的公司。但它60~70%的大规模裁员,这背后代表了什么?
以上是我想说的最近这三个月所发生的事情,在解释这些事之前,先谈一下我对智能机器人发展的一些思考。
智能机器人发展的思考
在15年前,我的学生就开始研究仿生机器鱼。
螺旋桨矢量推进在水下已经应用得很广泛了,但是由于它有空泡有噪声,在隐蔽性等方面引起了质疑。
通过对机器鱼整个的分析和研究,人们在想有没有可能未来出现替代螺旋桨,像自然界进化的鱼类一样,用软体的样子来进行推动,这是我们研究的。在这个方面,有MIT的实验室、有日本的,美国的,还有英国等其中各种各样的研究。
这个研究就是尾部以漩涡的方式产生了一个积极运作。从流体力学来说,就是形成了漩涡来推动机器往前走。在这个研究中,通过养鱼、加上摄像头等方式,按照一些数学模型来观测,还可以观察它的频率。
在这个频率中,通过数学方法可以建立波推动的理论。这个理论可以应用在我们的模型上,比如说用在六个自由度上。
那能不能把它做成圆的呢?因为形状是圆的,里面就可以装传感器,装仪器等。
在这个理论上基础上,六个自由度可以,那么四个行不行?三个行不行,最少是多少?它拍动的频率应该是多少?拍动的幅度是多大?尾鳍的形状会不会影响鱼行走的速度?
我们经过研究最后得出结论:从工程上来解释的时候,两个自由度最佳,因为它自由度小,意味着方便制造、设计和装配。
用这张图来说明我们在不同时期所设计的机器鱼。
为了深入地研究这些关系,会指导学生去深入研究流体力学所产生的一些科学问题,包括研究一些拍动的频率幅度弓角和相位差,用到推力频率和推动之间的数学模型上,来研究效率。
这一点非常自豪,感觉通过我们的研究,采用仿生推进机理的效率比传统螺旋桨要高,因为拍动的时候它一定会有效率有力,而且会平滑很长时间,不像螺旋桨空的时候有空泡,有时候有做负功。
在这样的研究下,我们一直想提高速度。比如一个海豚,小海豚假设60公斤,它的推力是什么?在一个水池里,架子上有一个力传感器,然后通过线来拍动它;当拍动的时候,力传感器为零,那么鱼的重量就正好是推力的重量。
那么在实际的这个应用中,如何搭建这个平台?
我们有两个方案:
一个方案是在一个有水潮的水池里,有8根张线,每个张线有力传感器,水潮按照一定速度来流,流的速度正好可以被检测到;后面尾气的大小可以换方的,可以换窄的,可以换协调,然后推动来使这个鱼往前走。当游的速度正好和水的速度相同的时候,绳子上的力从理论上讲,δ就趋近于0,那么这时候就能估算出这个机器鱼的速度,随后就可以换不同尾鳍的形状,换拍动的频率,换拍动的幅度,换两个自由度等等。
为了更科学地来计算它,可以在水池里打上类似粒子的东西。
我们目前把研究课题组分成了两个小组:一个小组接着再做解决仿真机器鱼速度的问题;另一个是在思考能不能跟海空跨介质一起。这样的一些项目我们还在研究和论证中。
第二个方案是把机器鱼的智能材料应用在工业界,这就是我们所说的软体手。
工业机器人只能从事0.5%到1%的工作,99%的工作基本上还替代不了。当然这个比例现在还在增加,但不管怎么样,其中很重要的研究课题是机器手的灵巧作业。
所以我们在想,有没有可能设计和制造一种灵巧手,他像人具有肌肉一样,不需要传统的机械加工,不需要传统的电机,完全用人工肌肉方法来探索,而且这种研究是不是能够适合于后工业时代,像很平常的东西一样被应用。如果这样的话,又需要考虑成本在未来的工业界是不是能被接受。
为此,我们就从智能材料和数学建模的角度来考虑。这样一个软体手,它的根部和手指材料可以不一样,是不是可以利用3D打印来做不同的材料配方,利用硅胶材料建立这样的模型。
在结构上,是不是利用高弹性的硅胶材料,加上不同的材料配方3D打印?这与内部的驱动有关系,这个驱动采用气体,或者采用液体。这就是我们的整个工艺,在这个工艺下就可以形成结构。
在结构中又会思考:完全是硅胶,会不会干度有问题?为此我们在智能材料和低熔点的传感器上,利用工艺方法,底下一层是低熔点的金属,再加硅材料,然后加一些形状,再利用3D打印融合起来。
这个事情一旦解决,就得出了“刚柔耦合”的灵巧手。
加了电,在低熔点的时候,金属是软的,承受50毫克的重量就会被压趴下;如果冷却不上电的时候,承受300克都不会弯。这就是干度耦合,也就是在一定程度上可以软的金属,加热变软之后又能够连接起来。
这样的结构和形状就是可变化的,比如说抓方形的东西可以是方形结构,抓圆状的东西可以是圆形结构。
在实验的过程中,让我们特别感到有前景的是,传统的机电手不仅有利于传感器,而且三个手指中,如果每个手指有三个自由度,成本大概在20万到25万,而软体手整个的成本只有它的1/10。
医疗机器人
通过这样的研究,大家是不是有这样的一种感觉:当今科技的创新,越来越强调基础学科的交叉。
我在清华博士后的时候,从事移动机器人,也就是无人车。随后在张博院士推荐下,到了欧盟就参加了欧共体的医疗相关项目。
那个时候是1995年,当时这种研究可以完全认为是实验室,至少在我当时跟很多老师交流的时候,他们会觉得中国工业机器人都还没有进入应用,医疗相关的离应用更遥远。
现在回过头来看,我们这25年,像达芬奇这样的医疗机器人,就已经大踏步地从实验室就走到了医院,而且不仅走到了医院,应用还很广泛,在软组织上,包括心胸科、腹腔、阑尾炎、泌尿科等等都有应用。
这些应用带来的发展,一是有限的医生能够做更多的手术了。二是过去靠实体眼睛看穿刺或者是缝合,现在能够放大40倍。
在为医生打造医疗机器人助手的时候,首先要解决一个定位问题,尤其是空间定位。我们用了两个双层模板,一个模板是用方的,上面有mark点牵玻璃,然后第二层用了圆的,也是由mark点,同时利用C型臂垂直照一下。垂直照了以后,图像上可以看到两幅图:一个是圆的图形,一个是方的图形。这个图形的两个点,把它串起来就是一条空间的直线。
如果把C型臂在水平照一下,同样也可以看到这个图像又是一条线。这两条线的交集,和要对准的那个点实际上是统一的,把这个点进行一个二乘,方差最小的时候就能得到这个点,这个点就是穿刺的位置。
这就是我们自己在理论上的一点点的贡献,称为“双平面定位”。在这方面我们的精度由原来的三毫米提高到一毫米,由一毫米提高到0.5毫米,能够在临床上广泛的应用。
这样的方法在脑外科之间是相通的。
在这个算法中,形成坐标系之后,如何将CT核磁的坐标系的肿瘤或者是脑出血的把柄映射到手术室?在国外,机器人、CT、手术床是一体的,标定了一次之后,后续可以继续沿用。但在国内,放射科是分开的,所以我们需要用不同的mark点来设计。
mark点到一定点距离、点的个数,其实和我们的精度都有关系。mark点实际上在数学里可以重构一个新的reference,在此基础上可以方便地把CT和核磁肿瘤的信息,以及新构造的reference对应起来。当把病人推到手术室,在手术室里利用视觉或者机器人对mark点进行再识别,又可以重构新的一个reference。
reference和机器人是对应的,reference和CT核磁时候的信息是match的,所以所有轨迹的规划就能映射出来。但是在轨迹规划过程中,穿刺到底是在什么位置,需要依赖于医生的知识。
这个原型系统包括坐标规划、机械臂和机器人。我在这方面研究了15年,学生一茬又一茬地毕业,有的学生出去以后进公司,又和医院,和北航不断地合作。
脑外科对于帕金森的治疗
坐轮椅走路很不方便,通过穿刺放入相应的药物,使病人能有所恢复,并且能够自由行走。
目前这方面的研究,我们跟相关学科都有合作,包括:物理学、计算机学等。
光子放疗这样的高端设备,其中机器人加上一个臂,这个臂的末端是核的放射加速器。床是另外一个机械臂,再通过规划,这样的话对放疗精准有很大的提高。这个项目目前也是在思考中。
服务机器人
我有位学生做短途代步方面机器人,在工程应用和商业上创业,他有提出一些自己的创新的想法,在这里跟大家分享一下。
他们做的机器人叫“纳恩博”,开始做to B的市场,在旅游景点上来使用,一个人花20块钱,那么能够站上10分钟或者是15分钟,在这个过程中发现使用空间还很有限。
于是想要做To C的市场,为了解决安全性,就把杆子给砍了,就是我们现在街上所看到的平衡车。
然后在这上面又可以有升降,上面可以有不同摄像头,可以有不同的形状。为了提高安全性,从人的姿态出发,人的姿态、角度和陀螺有关系,所以在陀螺上做了双备份,从控制到电池,到还有结构,成本非常高。
非常高兴的是他们一直是沿着高端路线走。在当时,其他友商的一些产品,都是采用杀价、铺量的路线,而他们一直和一些明星合作,和一些高端的客户走海外的市场。
但在专利上还很有壁垒,最后在小米、红杉的支持下,全资收购了当时最大的专利公司赛博威。
助力南极科考机器人
2012年,我在南极呆了几个月,做相关研究。研究大气变化和地质演变,研究南极的煤矿、石油、金矿是否存在。在那样恶劣的环境下,有没有可能用无人值守的机器人来探索,借用风能和太阳能给电池充电。
如果移动机器人在南极适用,那么在当今物流中也是可以广泛应用的,比如说汽车,在汽车制造厂可以借用机器人充当物流搬运汽车,而在停车场可以利用机器人停车来方便人们停车以及提高停车空间的利用率。
关于停车方面,我们在做这个方面的研究时发现,停车机器人还有很多问题,比如机器人的调度,累积误差,使用者停车取车相关数据的使用等等。
从机器人狭义的理解来看,机器人实际是一个能移动和操作的机械平台,而操作移动平台的思考,识别和智能,是由人工智能的大脑完成的。
机器的智能
我罗列了在2017年所有和机器人相关的东西,我的第一感觉是,人工智能中语音识别和思考,大大提高了人工智能在市场上的应用,同时又把这些技术放在机器人的大脑上,而推动了机器人的发展。
第二个感觉是软体材料和软体机器人结构,是机器人发展的一个重要动态。机器人没有走进家庭,除了我们所说的认知、交互和智能方面的原因,还有一个原因是这样的载体,要么不安全,要么成本很贵。这五年很多科学家就想从载体这方面进行突破。
人工智能在1956年就提出了,为什么会在如今这个时刻得到政府,工业界,学术界高度的重视?
前几天参加了昆山杜克大学关于人工智能的一个论坛,其中普华永道的分析师通过一系列数据,认为AI将对很多行业产生很大的影响。这就引发了我们的思考,在未来5到10年是否会有拐点的出现?所谓拐点,就是它会带动所有行业,重新洗牌,改变产品的功能、制造模式,甚至改变我们的生活方式。
所以有人说,在未来5~10年,厂厂都有工业机器人,并且有望进入无人化工厂模式,机器人代替人去做单调的重复的工作,还有无人驾驶,服务机器人,养老机器人,5G,无处不在的人机交互,区块链等等技术的发展。而另一方面,法律和伦理也是面临的挑战和难题,比如最典型的是AI的数据和排序的真实性,还有AI对我们身体的健康评估,对人类的就业问题等。
人工智能的历史发展,从图灵第一次定义了什么是智能开始,到军用的民用的机器人发展,人们对其赋予人的各种智慧的想象。
1956年的时候创建了很多实验室,希望能在20年内研制出能模仿人类一切活动的机器,但限于当时的背景环境,失败了。后来发展到5代计算机、推理机、AlphaGo等等出现。这个历程是个人理解,只作为分享。
颠覆性的技术,都是靠与其基础的交叉学科来突破,但是好奇、想象,和现实的需求很难得到统一,而真正落地的是一些有痛点,而社会又能负的起的应用,所以历史就是这么反复交汇形成的。
在机器人上也是一样发展的,从科学幻想到阿西莫夫三个规则,再到机器人专业手一直做不下去,后来在摩托车和汽车焊接线上得到利用,诞生了工业机器人,诞生的时代正好是70年代,而在这之前就有很多机器人研究的铺垫,人们一直研究机器人是因为有些特殊情况下人无法解决,比如说空间,军用,狭小的水下,管道等等,需要寻找替代人的东西。
机器人发展的历程,让人思考:同样是60年,同时代的个人计算机已经走入了千家万户,而机器人和人工智能没有走出来,在现在这个时间点上,机器人和人工智能能不能走出来,走进千家万户形成一个大的产业,迅速从2G到2B,再到2C,颠覆很多行业?
社会痛点、基础学科、科学家的幻想等一系列因素推动技术的发展,在这样一个历史时代下,我把机器人与人工智能合一起,定义为智能的机器,这样便于理解社会的需求和痛点。
但是真正被社会接纳的产品,不仅依赖于需求,也依赖社会的发展形态和人的经济所能支付的能力。在未来的社会里,由于丰富的制造,安全,医疗,和竞争需求,它们就变成动力来推动产品的实现。
在发达地区,从需求的角度理解,个性化的需求和制造就很重要,而在解决表露问题时,就派生出新的产品和服务,而这样的派生下,就出现了无人车,精准医疗,个性化的文化服务。需求有时候不能直接推动技术产品,它必须和社会形态、支付能力相关。
在当今社会条件下,大家有没有感觉,由于生活工作学习的节奏,由于我们国家的物质生活的丰富,已经淡化了个人需求,要由数据推送来进行服务消费。
这就形成了一个新模式:通过获取个人的需求来调整整个制造。这就是数据入口重要性的原因。
最后总结一下:智能时代的到来,它会改变我们很多方面,这个改变的时代有三个特征:颠覆性,涉及几乎所有行业的洗牌,以及很快从2G2B2C的转变。
Q&A
您在机器人方面做了很多的研究,现阶段来,我们对智能机器人看到的多,用到的少,那么在未来,会有什么样的智能机器人能进入我们的生活,在这中间需要一些什么样的技术和其它地方的突破?
我们生活在一个水煮青蛙的时代,大家不去仔细感觉,其实周边有很多单频的机器人,它已经在广泛的应用,比如说航拍,物流配送,展览大厅,医疗等等。而关于何时到家庭中,无处不在,这个问题上目前还没有找到相对统一的形态的机器。
这里有两种思路,有科学家认为可以不特定假想成一个人,只要有交互能完成特定工作就满足了;还有一种思路,能不能有一个标准的模块,比如仿人,但是从现在来看,目前的成本,安全,(非结构环节)都是对这个事是有质疑的。
目前在硬件方面中国目前还比较欠缺,在硬件方面,中国和欧美现在有多大的差距,未来会有什么样的发展呢?
从宏观来说,硬件方面追赶可能有5-10年。
基础的传感器,基础的部件,由于贸易的关系,从设计到制造、检测、组装等等环节都会受影响,这也是对国家的发展提出一些思考,看似消极,实则是能促进发展的。
个人认为中国在终端和中等水平的制造上,中国人因为勤奋,勤于优化,赶上国际水平可能还会更快一些,例如手机、吸尘器等等,别人提前10年有的,我们现在已经是世界第一。
所以综合来看,硬件方面的追赶可能还有5-10年。