智东西(公众号:zhidxcom) 文 | 十四
近日,麦肯锡发表研究报告,指出人工智能为分析技术贡献了40%的年度价值,加起来每年可创造3.5万亿到5.8万亿美元的潜在价值,相当于各个行业(2016)年度收入的1%到9%。
本期的智能内参,我们推荐这份麦肯锡AI前沿笔记,分析19个行业的400+用例,覆盖企业、物流、国防、旅行到公共部门等,盘点人工智能的业务功能和经济效益。如果想收藏本文的报告全文(麦肯锡:人工智能前沿笔记),可以在智东西头条号回复关键词“nc253”下载。
以下为智能内参整理呈现的干货:
人工智能的万亿价值
目前已知的人工智能最大的潜力在于分析技术,包括回归和分类。神经网络技术可以提供更高的功能性,或者产生附加的见解和应用。
案例表明,在旅行、交通、零售、汽车、高科技、能源、化工、娱乐传媒、基础材料、消费品、农业、银行、医疗系统与服务、公共部门、通讯、医疗制药、保险、先进电子器件/半导体、航天与国防这19个行业中,人工智能(AI,包括前馈神经网络和卷积神经网络)的引入,可以创造3.5万亿到5.8万亿美元的潜在价值,包括更有价值的产品和服务、收入的增长、成本的节约、消费者剩余等。
这相当于整体分析技术价值规模(9.5万亿到15.4万亿美元)的40%,对于每个行业而言,AI潜在价值平均占行业总规模的1%到2%。即便是应用潜力最小的航天与国防(少于500亿美元),这也相当于黎巴嫩的GDP了。
▲AI价值潜力:3.5万亿到580亿美元(行业年产值)
对于通讯行业,运营商有大量的结构化的客户数据,非常适合传统分析技术和AI分析技术,AI的潜在价值是行业年收的3%到6%,超过1000亿美元。同样的,对于公共部门,大量的数据和用例亦使其成为AI比较成熟的应用领域,但数据隐私和分析成功的可解释性/逻辑透明性限制了潜在的价值。尽管如此,公共部门依旧是AI技术非常大的潜在机会点。
AI分析技术还将用于各个行业的风险管理,如保险业更为精准的风险评估和保费设置,制药公司将AI算法用于降低临床试验风险,矿业公司预测生产中断风险,实现更有效的勘探、钻探和开采规划等。此外,AI还可创造新的产品和业务模式,如用于银行客户类型识别,可以有效改进的欺诈检测。
AI最大的价值机遇是供应链管理和制造业中营销和销售环节。对于公司而言,他们必须检查自己的部门组合,理解行业的价值驱动,寻找人工智能的布局机会,已确定合适的投资部署。此外,零售与高科技等消费行业将出现更多AI营销和销售应用,这是由于更为频繁的数字交互,特别是对电商平台而言,基于AI分析实时制定促销、价格和产品动态,利用生成模型优化端到端的供应链等,将有效降低各项成本,提高运营效率,实现精准营销。
▲AI最大的价值机遇是供应链管理和制造业中营销和销售环节
人工智能简明释义
为帮助读者建立更为具象的AI技术框架,本节对重要的人工智能相关概念进行简明释义。
人工智能指人造的机器智能,由1956年达特茅斯会议上正式提出。
机器学习是实现人工智能的主流手段,是基于一种数据训练的模型,即机器通过分析大量数据进行学习,无需编程从而归纳和识别特定目标,重在发现数据之间内在的相关性并做出预测。
▲各类分析技术在19大领域中的热度
1、神经网络
神经网络技术是机器学习下属的一个概念,本质上是从信息处理的角度对人脑神经元网络进行抽象模拟,从而建立计算模型。
基于神经连接的计算模型在上世纪40年代开始受到重视,大量的训练数据(包括图像、视频和语音)成功的实现了数据分析。在深度学习发展之前,神经网络通常只有3到5层,和几十个神经元/节点;深度学习之后,神经网络扩展到7到10层,甚至更多层,模拟神经元数目增至百万量级,从而面向更为复杂的问题实现更为可靠的处理。当下兴起的人工智能,主要就是大规模的深度学习。
具体来看,神经网络有三类主要形式:
1.1 前馈神经网络
前馈神经网络(Feed forward neural networks)是最常见的人工神经网络。在这种结构下,信息只向一个方向(向前)移动,即从输入层经过“隐藏层”到输出层,没有循环网络。首个单节神经网络在1958年提出,经过计算能力和训练算法的大发展,前馈神经网络展现出了更高的性能水平。
1.2 循环神经网络
循环神经网络(Recurrent neural networks)指结构中包含节点定向连接成环(loops)的人工神经网络,非常适合于处理(手写、文本、语音形式的)任意时序的输入序列。2016年11月,牛津研究报告显示,基于神经网络(和卷积神经网络)的系统在唇语识别应用中实现了95%的准确率(有经验的人类唇语者准确率近52%)。
1.3 卷积神经网络
卷积神经网络(Convolutional neural networks)是一种深度前馈人工神经网络,其逻辑结构受动物视觉大脑皮层的启发,对于大型图像处理(视觉感知任务)有出色表现。
▲最好的AI系统识别能力已经超过人类
2、其他机器学习概念
从学习的方式来看,机器学习分为监督式学习(训练数据集中的目标由人标注的)、非监督式学习(训练集没有人为标注)、半监督式学习(训练集被部分标识)和强化学习(输入数据作为模型的反馈)。
从算法的类型来看,常见的机器学习算法有决策树算法(采用树状结构建立决策模型)、回归算法(对连续值预测)、分类算法(对离散值预测,事前已经知道分类)、聚类算法(对离散值预测,事前不知道分类)、神经网络和集成算法(集成几种学习模型)。
为帮助后文理解,以下进一步说明两类在新生业务中极具潜力的机器学习技术:
▲不同用例中的数据类型(结构化程度、时序性、文本or音频or视频or图片)
▲不同类型数据的AI价值
2.1 生成对抗网络/GANs
生成对抗网络(Generative adversarial networks)是深度学习领域的一个重要生成模型,即两个网络(生成器和鉴别器)在同一时间训练并且在极小化极大算法(minimax)中进行竞争。这种对抗方式避免了一些传统生成模型在实际应用中的一些困难,巧妙地通过对抗学习来近似一些不可解的损失函数,在图像、视频、自然语言和音乐等数据的生成方面有着广泛应用。
2.2 强化学习
强化学习(Reinforcement learning)本质上就是通过试错实现模型优化。目前,强化学习已经被广泛采用,包括谷歌Deepmind的视频游戏和AlphaGo。
3、分析技术之于实际问题
▲分析技术:从经典到前沿(将深度学习神经网络、迁移学习和增强学习定义为AI技术)
分析技术在不同业务类型中可以解决多种实际问题,包括:
分类(Classification),即根据一组训练数据,将新输入的数据进行分类的业务,主要任务为识别特定物理对象(如卡车、汽车、生产线上接受质检的产品等)的图形;
连续评估(Continuous estimation),即根据训练数据,评估新输入数据的序列值,常见于预测型任务,如根据销售数据、消费者态度、天气等数据来预测消费需求,或者根据建筑物的相关数据和照片来于猜测房产价格等;
集群(Clustering),即根据任务数据创建系统单个组类别,案例有,基于特人数据的消费偏好;
其他优化(All other optimization),即系统根据任务产生一组输出为特定目标的函数优化结果,案例有,基于用户(时间、费用、偏好等)需求的最佳交通路线推荐;
异常检测(Anomaly detection),即根据训练数据/历史相关性判断输入数据是否异常,本质上是分类功能的子范畴;
排序(Ranking),常见于信息检索问题,即基于检索需求按照某种排序标准呈现结果,比如提供产品购买推荐等;
建议(Recommendations),即根据训练数据提供建议,比如根据个人购买历史行为推荐“下一个产品”;
数据生成(Data generation),即根据训练数据生成合适的新数据,用例包括音乐创作等,即根据音乐素材在特定风格下创作出新的音乐片段。
▲不同类型实际问题涉及的分析技术(条状图表征该问题中AI技术的价值和潜力)
从用例看潜力
讲解完抽象的概念名词,是时候来关注具象的实际案例了。先来说说人工智能算法跟传统算法相比,在性能方面的优势(总体而言,AI分析技术能带来传统之外的30%到128%的行业价值提升):
▲AI分析技术的价值潜力(左为AI与传统分析技术的对比,右为AI分析为19大行业带来的潜在价值增量)
预测维护
传统系统,已经能够对传感器时序数据,包括检测温度、振动状态等,进行分析,实现预测异常检测和预测维护(对组件的剩余使用寿命做出预测)了。但深度学习将这个功能带到了一个新的高度:可以对数据进行分层,从而分析海量的、高维度的,包括图像、音频等各种形式的传感器数据,一些原先不适用的低质量数据(来自廉价的麦克风和照相机)也能被用起来。
在被调研的案例中,这种基于AI技术的预测维护(远程机载诊断技术),可以帮助企业减少停机时间,制定有计划的干预措施,提高产量,并降低经营成本,对应的经济价值约为总销售额的1%到2%。
在货运飞机的案例中,AI技术加持的预测维修,能够延长飞机寿命。因为相比于传统模型,它能更有效的结合平面模型数据、维护历史、物联网传感器数据(包括发动机振动数据、发动机状况的图像和视频等)。
物流优化
以AI为导向的物流优化可以实时预测,降低成本,指导行为,提高燃油效率,减少交货时间。
在一个欧洲货运的案例中,基于AI技术的车辆性能检测和驾驶员行为分析,司机能够获得实时指导(合适加速、减速等),以优化燃料费用并降低维护成本,货车公司省了15%的燃油费。在一个航空案例中,航空公司基于AI预测交通拥堵和天气相关问题,避免了昂贵的取消费用。对于每天航线近十万的公司而言,哪怕减少1%的取消飞行,也意味着很大的不同。
客户管理
AI正在成为客户服务管理和个性化市场营销的重要工具。
呼叫中心将AI用于语音识别(不仅是语言内容,甚至是情绪语调)和呼叫路径规划,可以更有效的为客户提供更为无缝的体验;在销售领域(如亚马逊和Netflix),AI也成功的用于个性化的“下一个”产品推荐,大幅提高了销售转化率;在保险领域,汽车保险保费可以根据驾驶数据(驱动模式和距离)进行调整;对于旅游公司,全方位的客户视图(额外的酒店、航班服务)将帮助增加10%到15%的收入,相当于总营收的7%到12%,价值是传统分析的两倍以上;在零售业,SKU性能数据能被用于优化促销策略。
▲各类分析技术在九项业务中的应用热度
根据调研,69%的案例中AI分析技术完成了对传统分析技术的性能优化,16%的“绿地”案例非AI不可。“绿地案例”主要存在于客户服务等商业领域,如疾病诊断、改善护理等,对应的数据丰富(大量音频、视频、图像和文本),还需要整合人类的反应。
此外,还有15%的案例是AI分析,或者说深度学习不适用的,比如药品和医疗产品、电信等领域,一方面是受限于现有的技术和该领域不够充足的结构化的数据量(据估计,一个监督学习算法要实现可接受的性能,每个类别需要至少5000个标记过的数据),另一方面受限于行业和监管问题。
除了使用深度学习提高分析性能之外,很多常见的消费产品,如Siri、Alexa和Cortana,甚至基于图像处理的自动驾驶也在发展中。对于这些AI系统,数据采集和再培训是必要的(需要至少每月更新一次,有时甚至是每天更新一次)。除了数据量和多样性之外,训练数据的刷新也很重要,特别是销售、供应、管理和制造业领域。
▲对于大约三分之一的用例,AI分析模型需要频繁更新(四分之三的情况需要每月更新一次,近四分之一的情况至少每周更新一次)
前路的挑战
尽管人工智能前途远大,它依旧面临着诸多的挑战和限制。
从数据的角度出发,可以把困难归纳为五点:训练数据的标记常常需要人工手动,难以获取足够大且全面的训练数据集(特别影响医疗用例),模型透明度有待提高(直接影响汽车、医疗认证等领域的应用),学习缺乏可概括性(难以从一个应用迁移到另一个相似的应用),数据和算法中存在偏差的风险(更社会化的问题)。
此外,人工智能还存在恶意使用的问题,包括更为复杂的黑客攻击和高度个性化的政治虚假信息运动、欺骗性的视频等一些列安全威胁。
考虑到数据的关键性,对于企业和组织来说,制定数字战略,建立数据中心(或者更普适的,选择云供应商),争夺高级人才,思考获取和生成数据的方式,至关重要。技术方面,组织必须开发出健壮的数据维护和治理流程,并实现软件现代化(如Agile和DevOps),并确保AI分析被实例化,克服“最后一英里”(组织挑战)。
智东西认为,AI作为当下信息技术革新的主要动力之一,指向了庞大的经济和社会价值,正在将各个参与者,包括(技术)革新者、公司和
政策制定者等,凝聚起来,从而营造充满活力产业环境,确保更为安全、有效的经济和社会福利。现有案例足够说明,AI技术的引进,不仅将深化传统技术价值,更将拓展新的产品和业务形态。对于企业而言,相关数字战略的制定,迫在眉睫。