以下观点来自兴证深圳机构业务,不代表本站观点。
人工智能从2016年起,就是创业公司的主战场,也是VCPE公司投资的一大方向。小兴今天仍与各位客官共同探讨人工智能发展现状。今天,我们主要来分析人工智能基础资源,包括
大数据、计算力,以及其基础技术,包括语音识别,自然语音处理和计算机视觉。
AI基础资源——结构化数据缺失,计算力大幅改善
AI的基础资源包括算法、硬件(即高性能的计算机)和数据,其发展状况如下:
1.大数据:海量数据存在,结构化数据依旧缺乏。数据是训练人工智能的必备燃料,在现阶段人工智能的发展水平下,数据的规模和质量直接决定了模型的训练效果。如今,市场上存在着海量数据,但是,仅仅关注数据规模远远不够,只有结构化的数据对于训练人工智能才有意义。将数据结构化的过程包括数据采集、清洗、标注和建模。创业公司获得结构化数据的方法主要为三种:
1)利用学术界和大公司对外开放的免费数据库。
2)通过第三方数据供应商或众包平台购买或定制数据。
3)在某些特殊场景,自行采集实际数据或模拟数据。
2.计算力:人工智能的计算力有着显著提升,目前市场上存在的计算芯片主要包括GPU,FPGA,ASIC和类脑芯片,主要特点和典型厂商如下表:
AI基础技术——语音识别仍在发展初期,自然语言处理和计算机视觉持续爆发
1.语音识别:大玩家业务模式趋于一致,初创公司力求与大玩家实现业务互补。行业目前的发展现状特点突出,即巨头们会倾向于打造属于自身的技术链条,将语音识别和自然语言处理化为平台的一部分,把新技能的开发以及前端唤醒等处理开放出来。典型的语音操作系统分为三层,分别为能力层,即赋予第三方开发者基于系统开发各种语音技能的平台;核心层,即对话系统;
应用层,即智能设备场景应用平台。初创公司若是与巨头正面竞争,危机重重,最好的方式是关注于能和巨头业务实现互补的业务,如前沿声学及远场语音交互等硬科技的研发,从而借助大势获得发展。
2.自然语言处理:技术发展完善,交互式智能服务风口即将到来。在过去20年里,自然语音处理技术已经成为互联网应用不可缺少的基础技术。搜索引擎是自然语言成功应用的经典案例,围绕搜搜引擎出现的推荐系统、广告系统都集成了大量自然语言处理技术。以BAT为代表的互联网巨头纷纷投身AI,全面拉开了
人工智能产业的国内的发展。而未来,自然语言处理技术将向交互式智能服务发展。、首先,要进行以语音为主的交互方式的接入,并推进对话能力的大规模定制。其次,要构建企业专有知识体系,将企业自身拥有的专有知识结构化,从而最终实现自动交互。在自然语音处理应用下,企业最终会拥有自己的专用数据和知识,并最终生成相应的自然语言理解模型等,将企业自身的知识转化为可交互式的。未来进一步的发展趋势是不同企业、不同行业通过开放转悠知识资源,加快建立有机生态。
3.计算机视觉:产业链大爆发,人脸识别最受关注。计算机视觉,是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量,建立能够从图像或者多维数据中感知“信息”的人工智能系统。
计算机视觉行业的爆发基于以下三点技术的提升:
1)得益于互联网、社交媒体、移动设备和廉价的传感器,从市场上产生并存储的数据量急剧增加,这加速了深度学习的发展;
2)并行计算和GPU硬件的出现,使得运算能力大大提升,有效缩短了深度学习的训练时间,加速技术的更新换代;
3)深度学习算法大大提升了人工智能在计算机视觉、语音、图像处理等应用层面的准确性。
从产业链上分析,计算机视觉产业链可以分为:1.基础资源支持层,包括芯片和初级算法提供商。国内芯片领域起步较晚,最有代表性的创业公司为中科寒武纪,其已经发布了面向计算机视觉的1H8处理器;2.技术提供层,指基于开源基础算法框架开发的垂直行业的专用算法,如人脸识别、车辆识别、字符识别等;3.场景应用层,即直接面向客户的需求提供应用系统或终端产品。行业未来的发展方向,一是人脸识别在生物识别领域将替代指纹识别,逐渐成为主;二是计算机视觉的专用底层软硬件,包括底层芯片、操作系统等将成为发展的热点。