机器之眼
不要把鸡蛋放在一个篮子里,Face++也不愿意把商业化全部押在金融行业的人脸认证。技术出身的他们,还想到了另外一件还挺创客范儿的事,想做一个基于摄像头数据结构化的IFTTT平台。
这个概念听起来还挺绕口,其实理解起来就没那么复杂了。比如,我们常见的门禁系统,就可以设定成 “If 在公司门口识别到公司同事, then 打开公司门禁不用刷卡”;奢侈门店的vip识别,本质上就是“If 在商店门口识别到 VIP 顾客 ,then 销售经理应该给于个性化的体贴服务”。
IFTTT 本身就蕴含来无限的可能,只要可以抽象出条件、执行动作,调用Face++ 的技术,就可以自定义自己的智能监控和智能家居应用:If 公司门禁识别到所有的员工已离开办公室, then 关灯;If 门禁识别出员工当天第一次进入办公室, then 自动推送当然的工作计划到员工手机和邮箱;If 家门口的摄像头识别出我已到家, then 煮上完最爱的咖啡,电视机调到我最爱的频道……
如果再把上面的这些事情抽象化,Face++做的其实就是机器的眼睛,让机器分辨人与非人,识别我与非我。仅仅不再“脸盲”的眼睛,还算不上智能。 Face++还想让他们的机器认出非人部分的品类,从识别“人”扩展到识别“物”、“人和物”之间的关系,后续还会推出 Image++ 和 Video++ 平台,打造真正的“机器之眼”。
看到这里,估计大部分人都要打断我了。这确定能做到吗?我脑子里也是一堆一堆的问号。
传统的 人脸识别 采用图像处理和 模式识别 技术,利用脸部器官的形状、大孝位置以及它们之间的相对位置等特征,通过普通光学摄像头采集脸部图像,提取图像上眼、鼻、嘴的大孝位置以及它们之间的相对位置等特征数据,然后与预先保存的脸部特征值进行比对,根据比对的结果,实现对身份的识别。
现在 Face++利用模拟人脑的深度学习技术,让机器可以从海量数据中自动归纳出各类面部特征,如五官布局,皮肤纹理等信息,然后与预先保存的面部特征库进行比对,根据比对结果,实现身份识别。这其实还是以五官为基础的。那么这么多种非人的物体,如何一一抽象出它的特征呢?Google brain 项目学习了那么多年,也仅仅只是能识别出喵星人。
我们要做未来“机器之眼”,所以一定是要从单一识别“人”,到识别更多的内容。从深度学习的角度来说,“人脸”和“物体”在很多地方有相似之处。“ 人脸识别 ”关注的更多是细节识别,看两个脸到底有什么细节区别;而很多物体识别,关注的是两个不同类别东西有什么区别,“猫”和“狗”有什么区别。但从技术框架上来说还是很相似的。
技术与资本的角力
技术型创业公司往往会面临不少压力与风险,埋头做技术也许就会默默无闻,失去宣传推广、商业合作、获取融资的可能;高调做事也许就会因为暂时性的不足而备受指责,甚至失去商业合作的拓展机会。
前几天有人跟我讲过这样的一个观点:最近一段时间国内不少技术型创新公司纷纷主动寻求报道,也许是感受到了资金上的压力。在还没有形成技术投资氛围的国内,技术公司还很难得到资本的青睐与认可。估计每一个自我定位为“技术流”团队,都会感动身受。事实上,也许每一轮新的融资注入,技术团队都会面临转型甚至商用的压力。
上次报道完Face++融资的消息,也有童鞋从一个旁观者的角度提了这样一个观点:资本对国内技术公司的青睐也许无形中就会扼杀掉无限可能。资本逐利,早期融资看重接盘的可能。投资技术公司,风险大退出难,自然有顾虑。但也有不少投资机构看到有技术背景的项目就趋之若鹜,在大饼都没有画出来时就纷纷“慷慨解囊”,也许就会传达出一种错误的信号,过分助长技术人才的自信,迷失自我定位,而过早地在资本的压力下考虑技术商用,本身也许就是一种伤害。