区分外形一模一样的机器方法只需要看编号,但是直接从有机特征来区分人,这并不容易。就好像至今仍未完工的大教堂“圣家堂”的设计者高更所说,“直线属于人类,曲线属于上帝。”——人脸不光是由复杂的曲线所构成,还有毛发、痣等特征,而且随着年龄的成长、阅历的变化,人脸也会发生细微的变化。
不过,如果要机器/机器人在未来给特定的、不同的人提供服务,记住并认出一个人的脸是首要的事情,毕竟没有人愿意在和机器人聊天之前,还要输入一长串自己记不住的密码。
今年 5 月成功融资 4700 万美元 Face++ 是人脸识别领域倍受瞩目的新创公司。它所提供的技术服务,被糅合进多款亿级用户量的产品当中,包括支付宝的“刷脸支付”,美图系一系列产品(美图手机、美图秀秀、美颜相机),Camera360,世纪佳缘。
不仅如此,Face++ 还被中信银行、江苏银行、网商银行、积木盒子、拍拍贷、小米金融等金融公司采用,来验证客户的身份。
机器人认出人脸,之后?
2014 年上半年,Face++ 连续在 3 个世界技术比赛获得排名第一的成绩,显示出团队雄厚的技术实力,包括:
人脸检测(在照片中精准定位人脸位置的算法),在世界公开评测集 FDDB 排名第一;
人脸关键点检测(精准定位面部关键部门的位置),在世界公开评测比赛 300-W 排名第一;
在最重要的互联网图片人脸识别(Face recognition)比赛 LFW 中,Face++ 团队更是力压 Facebook 人脸识别团队(前被 Facebook 用 6000 万美元收购的 face.com 团队),获得世界第一。在极难识别的互联网新闻图片上,获得了97.3%的准确率。
印奇对爱范儿说,脸部识别归类可为两个大场景,“一个叫做静态的人脸识别,一个叫动态的人脸识别,静态的意思就说基本上是基于一张照片,和一个数据库来去做人脸这种识别和比对……第二个动态,基本上意思是说,基本上在这种视频这种监控的视频里,然后可能在人这种可能在运动的情况下,对它进行人脸的抓拍和识别。”
第一种静态人脸识别的技术成熟度已经很高,Face++ 的合作伙伴大部分基于这个类型,一个是识别人的脸部特征,从而实现精准的调整。比如在和美图系产品合作的时候,Face++ 就提供人脸检测、人脸追踪、关键点检测技术,让 app 可以精确定位人脸当中需要美化的部分。
二是实现身份的识别。2013 年世纪佳缘使用 Face++ 的技术,推出“最佳伴侣”通过人脸识别技术对网站的人脸数据库进行分析、精准配对,让世纪佳缘的会员可以相互匹配。因为在该方面技术成熟,Face++ 的技术还应用了支付宝的“刷脸支付”,以及各个金融公司的身份验证环节当中。
然而,在动态人脸识别方面,因为技术挑战难度更大,目前只达到相对可商用化的程度。印奇用解释了这方面的挑战,“从视频监控角度来看,有一类叫‘通道式’,比如放在机场安全门上的监控摄像头,它可以抓拍到大部分人的正面,所以它的动态人脸识别难度不高,可以只识别高质量的正面照片。不过,如果是在火车站这种开放式的场景下,动态的人脸识别的难度就很高了,一是分辨率低,二是角度千变万化,识别系统需要一套多张的照片结合 3D 建模和识别的方法来提高人脸识别的精度。”
印奇认为,Face++ 的发展有两个比较重要的里程碑,一是 2012 年将“脸部识别云平台”将这个概念产品化;二是在今年将脸部识别与金融行业的应用结合起来,“相当于将从一个比较泛的平台到一个可以被落地的场景化产品”。他透露,今年 Q4 Face++ 将发布几个新产品,预计也是团队的下一个里程碑。
Face++ 已经和中信银行、江苏银行、网商银行、积木盒子、拍拍贷、小米金融等金融公司达成合作,将脸部识别技术融合进他们的产品当中。印奇解释,金融公司将脸部识别当成高效、安全的验证手段,广泛运用在银行的各个业务里,包括柜面的辅助验证、以及高额放贷等等。
深度学习才是核心
Face++ 联合创始人印奇说,“脸部识别是一件很难的事情。”
人的容貌会随着环境的变化而变化,而且还会自己打扮自己,或者说随着时间而变化,胖子变成瘦子,瘦子变成胖子,这些因素夹杂在一起,会令脸部识别的难度变高。所以,脸部识别的真正兴起和深度学习的发展有深度的关联。这也是团队从成立开始一直着重的发展方向。
“深度学习是一个非常依赖于数据的技术”,印奇说,“在早期我们做人脸识别的时候,数据来源不足,因此内部开发许多数据系统,通过互联网的手段去爬娶标注大量有效的数据。所以我们其实相当于一步一步从前到后推演,开发一个很复杂的工具来解决前置性的问题。现在我们底层基础建设做好了,技术研发就相对顺利。”
“尽管中间遇到一些困难,但在遇到困难的时候,团队的士气反而高昂,大家都是喜欢挑战的聪明人,另外我本人比较好胜,在遇到困难的时候,会更加注意激发团队的潜力。”
——如果说人脸识别是一种“招式”,那么“深度学习”可视为一门“心法”。当 Face++ 团队在深度学习上深耕的同时,他们也可以将这个技术应用在更多的方面。印奇说,“Face++ 是我们团队推出的第一款产品,我们母公司叫旷世科技,专注与计算机视觉、图像识别这个大方向。现在计算机视觉有一个概念叫‘云 + 端’,云端是智能化的识别引擎,而在端的方面,各种新兴的传感器、包括更好的摄像头等等,我觉得有非常大的机会。”