移动眼,不同于谷歌无人驾驶汽车的另一种可能
人生中顿悟的一刻到来时,阿姆农·沙舒瓦还是一个年轻的计算机专业本科生。那时他正坐在耶路撒冷一所大学的图书馆里阅读一篇用希伯来语撰写的文章,当时他兴奋地发现,在很多方面,人的视网膜与计算机十分相似。文章的作者是西蒙·厄尔曼,计算机视觉研究先驱大卫·马尔的第一位博士生,也是人类与机器视觉专家。意识到人类的眼睛中也进行着计算后,沙舒瓦对这一过程十分着迷,他决定追随厄尔曼的研究脚步。
在麻省理工学院,沙舒瓦师从计算机视觉科学家汤米·波乔和埃里克·格里姆森。波乔的研究涉及神经科学和计算机科学,而格里姆森后来成了麻省理工学院的副校长。当时,从捕捉到识别形状的过程中看似没有障碍,但实际上编写识别软件却十分艰难。即便是在今天,“场景理解”的目标仍可望而不可即,例如,不仅识别出一个女人,同时也要识别出她可能做些什么。人们也仅是在一些小的领域取得了值得注意的进步。举例来说,现在很多汽车都能够及时识别出行人或自行车,从而在发生碰撞前自动减速。
通过脚踏实地钻研这些琐碎的技术,沙舒瓦逐渐成长为一位大师。在学术世界,脑科学家与计算机科学家还在争论不休的时候,他的立场很简单:“飞机不会扇动翅膀,但这并不意味着它们不能飞。”
研究生毕业后,沙舒瓦回到了以色列。而在这之前,他还开办了自己的公司Cognitens,利用视觉建模技术对工业零部件进行精准三维建模。这些图像能准确到头发丝的级别,让从汽车到航天领域的制造商们能够对现有零件进行数字化建模,从而检查其是否合适。不过,他很快就出售了这家公司。
在寻找新项目时,沙舒瓦从以前一位汽车行业内的老客户口中听说,有汽车制造商希望能够实现加强计算机辅助驾驶的立体视觉技术。他们对沙舒瓦在多视觉几何领域的工作有所了解,于是询问他是否也对立体视觉有想法。他回答说:“这很好,不过你并不需要一个立体系统,一台简单的摄像机就够了。”他指出,在某些情况下,人类在闭上一只眼睛的情况下仍然能够判断距离。
凭借自己创业家的功力,沙舒瓦成功说服通用汽车公司投资20万美元用于开发演示软件。他立即叫来了自己在商界的朋友谢夫·阿维拉姆,并建议创办一家新公司。他们给新公司起名叫“移动眼”(Mobileye),沙舒瓦亲自编写了台式机展示用的软件,然后展示了摄像头的机器视觉,这对当时的汽车制造商来说就好像是科幻小说一般。
项目开始6个月后,他从一个汽车行业的大型供应商处得知,通用汽车公司计划展开一场竞标,寻求一种用来警告驾驶员车辆偏离车道的方式。在这个项目上花了几个月的时间后,沙舒瓦在车道中保持行驶的软件写得初有成效,但沙舒瓦却意识到,对于愿意率先起步的公司来说,这可能还不够好。因此,这家羽翼未丰的公司很难一举胜出。
后来,他有了一个好主意。他在这款软件中补充了车辆检测功能,但告诉通用汽车公司这个功能存在错误,不要在意。“在下一个版本中我们会解决它,所以你们可以忽略它。”他说。这一句话就已足够,通用汽车公司为能够以低成本检测其他车辆从而提升车辆安全性的想法欣喜若狂,于是决定立即取消投标,并承诺为这家新公司提供项目资金。车辆检测能够推进新一代安全功能的研发,这些功能并不会取代驾驶员,而是通过隐形的传感器、计算机安全网来增强车辆的安全性能。诸如车道偏离预警、自适应巡航控制前方碰撞预警和防碰撞制动等技术正在迅速向前发展,并成为汽车的标准安全系统。
<上一页1
2
3
4
5
6
7
下一页>
余下全文