人工智能产业生态格局的三层基本架构如下:
底层为基础资源支持层,由运算平台和数据工厂组成;
中层为AI技术层,通过不同类型的算法建立模型,形成有效的可供应用的技术;
顶层为AI应用层,利用中层输出的AI技术为用户提供智能化的服务和产品。
每一层架构中,都有不同的企业参与,最终形成围绕AI技术,产品和服务的生态圈。
4.2.1 专用领域人工智能生态圈的格局
1、基础资源支持层实现路径:运算平台+数据工厂
基础资源支持层通过部署大规模GPU与CPU并行计算构成的云计算资源池(定义为超级运算平台)来解决AI所需要的超强存储和运算处理能力问题,并辅以能够抓取到汇聚了人类智慧的海量信息的大数据工厂作为数据集,为AI技术层的实现提供有利支持。
超算平台负责存储与运算。人类没有记忆就没有关联,也更不用说决策与创造,而构成记忆的基础正是有极大存储能力的脑容量,那么机器要模仿人脑也必然首先要拥有庞大的存储能力,海量数据的积累最终让机器的“存储”形成类似于人类的“记忆”。
百度在发展人工智能的道路上,首先做的也是不断扩大其存储能力。
除了存储的绝对容量之外,运算处理能力是第二个需要提升的硬实力。
运算处理能力有两个方面,第一是服务器规模,第二是特征向量大小。所谓特征向量简单理解的话就是指将文本语音图像视频等内容转化为机器能够读懂的一连串关键数据,数据越多,机器学习的就会越好,但对服务器的压力也会相应加大。百度能够仅用两年时间从10万特征向量直接飙升到200亿,足以见得百度服务器技术实力的雄厚。在这个过程中,还需要解决大规模GPU和CPU并行计算所带来的错误率提升以及散热难度加大等问题,因此,是否能够搭建超算平台成为了人工智能企业的重要进入门槛。
数据工厂实现分类与关联。数据工厂会对数据进行基础性的加工,而这种加工又非常关键。从人类的记忆联想模式分析,要调取某部分的记忆,就会很自然的联想到某个词,某个画面,某个音乐等等就能记起很多事情。这是因为人类大脑的神经连接结构允许我们这样去检索,而机器是不允许的,数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念。如果需要机器理解用户的语言,这种搜索技术也依然要机器的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,数据工厂所依托的搜索算法,就是在这么一个数据海洋中去为他们建立管理,然后去索引。数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等等建立起动态关联的过程。因此,通过数据挖掘和搜索算法对数据工厂中的知识库和信息库进行分类与关联的技术能力同样是人工智能企业的重要进入门槛。
<上一页 1 2 3 4 5 下一页>