7月11日,专注于计算机视觉和深度学习的AI企业商汤科技宣布完成4.1亿美元B轮融资,创下全球人工智能领域单轮融资最高纪录,这条新闻引爆了行业热点。商汤科技凭借着“计算机视觉”这一黑科技获得巨额融资,那么什么是计算机视觉呢?
近年来,为了让机器更像人,能够认知事物,从而进行判定和深度学习,计算机视觉技术方法与 应用 发展迅速。计算机视觉研究如何让计算机可以像人类一样去理解 图片 、 视频 等多媒体资源内容。例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或进行仪器检测的图像。近些年在海量的图像数据集、
机器学习(深度学习)方法以及性能日益提升的计算机支持下,计算机视觉领域的技术与
应用均得到迅速发展。
当下机器视觉技术已经渗入到我们的日常生活中,从手机里的美颜APP面目识别功能、人脸相册分类,到支付宝面部识别身份验证、储物柜人脸识别,以及 工业机器人 对物体准确抓取、物流 机器人 障碍避让等等都是运用了计算机视觉技术。
国内外众多知名机构在计算机视觉不同方向均有涉及,国内更是涌现出一批相关的明星创业团队。除了耳熟能详的Google、微软、Facebook等工业界科技巨头有所涉及之外,一些着名高校也设有专门的实验室,如斯坦福、麻省理工以及伯克利等。国内则涌现出一批以依图、商汤、旷视、云从以及格灵深瞳等为首的创业公司,技术团队核心成员大多拥有前述工业界及学术界知名机构的研究经验。
下面就详细梳理一下计算机视觉的应用领域:
人脸识别
“人脸识别”是
人工智能“计算机视觉”领域中最热门的应用,今年 2 月,《麻省理工科技评论》发布“2017 全球十大突破性技术”榜单,来自中国的技术“刷脸支付”位列其中,今后靠脸吃饭完全不是问题。这是该榜单创建 16 年来首个来自中国的技术突破。人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。
视频监控分析
人工智能技术可以对结构化的人、车、物等 视频 内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。
视频监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。
工业视觉检测
机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。
机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。
医疗影像诊断
医疗数据中有超过 90% 的数据来自医疗影像。医疗影像领域拥有孕育深度学习的海量数据,医疗影像诊断可以辅助医生,提升医生的诊断的效率。
2015 年 4 月,IBM 成立了 Watson Health 部门,开始进军医疗行业。2015 年 8 月 6 日,IBM 宣布以 10 亿美元的价格收购医疗影像公司 MergeHealthcare,并将其与新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥资 26 亿美元收购医疗数据公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大会上 Watson Health 公布了 IBM 的第一个认知影像产品 Watson Clinical Imaging Review,该产品可检查包括图像在内的医疗数据,帮助医疗服务提供商识别需要关注的最危急情况。
文字识别
计算机文字识别,俗称光学字符识别,它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。这是实现文字高速录入的一项关键技术。
今年三月份,海康威视研究院预研团队基于深度学习技术的 OCR(Optical Character Recognition,图像中文字识别)技术,刷新了 ICDAR Robust Reading 竞赛数据集的全球最好成绩,并在「互联网图像文字」、「对焦自然场景文字」和「随拍自然场景文字」三项挑战的文字识别(Word Recognition)任务中取得第一。同期参赛的有来自 82 个国家的 2367 支队伍参加,其中包括 Google、微软、百度、三星、旷视等团队。
如今“计算机视觉”成为了小风口,大量资本涌入,而 2017 年可能将是人脸识别产业应用产生突破性进展的一年。人脸识别和视频监控两大方向最受资本青睐,同时技术也在寻找其他方向的突破。