区块链可以看做是分布式的数据、算力、算法的资源集合体,所以“区块链+AI”被看做是一种解决传统AI难题的良药。本文立足于传统人工智能的现状与痛点,重点分析了11个区块链+AI项目,总结了区块链与人工智能在数据、算力、算法三方面的优势。
AI和区块链的发展是由区块链引发的,不是AI领域的单边需求,因此投资逻辑在于探索交叉领域给双边的机遇。文章最后给出了区块链+人工智能类未来的发展趋势。
节点研究中心
作者 赵越 朱子川
编辑 郎瀚威
本文顾问
田甲 汪婷婷 王超
目录
1人工智能行业现状
1.1人工智能的概念
1.2人工智能的历史
1.3人工智能产业图谱
2人工智能行业的痛点
2.1数据:被大型机构垄断,数据标注质量差
2.2 算力:硬件成本高
2.3 算法:人才短缺,研发进度缓慢
3区块链+人工智能行业整体分析
3.1区块链+人工智能行业项目一览
3.2 区块链+人工智能赛道市值与总市值关系
4区块链+人工智能类项目
4.1数据类项目
4.2算力类项目
4.3算法类项目
4.4项目投资明细
5区块链+AI项目投资逻辑
5.1 数据
5.2 算力
5.3 算法
6区块链+AI项目未来趋势
6.1商业趋势
6.2技术趋势
7参考资料
1人工智能行业现状
1.1人工智能的概念
人工智能(Artificial Intelligence),英文缩写为AI。日常生活中接触的人工智能多指深度学习,即多层神经网络,如图1所示。它是研究、开发用于模拟、延伸和扩展人的智能的技术科学。本质上是通过统计数据,并从中归纳出模型。
图1深度学习模型
1.2人工智能的历史
“人工智能”一词最初是在1956年DARTMOUTH学会上提出,1975年之后学者开始着手研究BP(Back Propagation,后向传播)算法,现在使用神经网络时,大多是在使用BP算法进行训练。1986年之后,学者们实现了BP网络,同时期计算机硬件能力快速提升。2006年之后,随着移动互联网发展,海量数据爆发,深度学习算法在语音和视觉识别上实现突破,人工智能商业化高速发展,人工智能关键时间节点如图2所示。
图2人工智能关键时间节点
1.3人工智能产业图谱
人工智能产业图谱的角色包括了数据和计算资源的提供方,算法、产品及解决方案提供者,终端落地行业如金融、公共安全、教育等
如图3所示,数据、运算力和算法模型是影响人工智能行业发展的三大要素。
图3人工智能产业图谱
图片来源:艾瑞咨询中国人工智能行业研究报告(2018年)
2人工智能行业的痛点
2.1数据:被大型机构垄断,数据标注质量差
互联网巨头,像谷歌、微软、苹果、Facebook、阿里、腾讯和亚马逊,基于海量用户数垄断了我们的数据。现在的人工智能多为有监督学习,需要对数据进行充分标注,并非所有类型的影像数据都易标注,例如如医疗影像数据需由专业医师标注病灶,业界领先的视觉公司一般会有数百人的标注团队,但标注多为外包,缺乏专业培训和实时指导,导致被标注的数据质量差。
区块链如何解决:区块链是一种以密码学技术为基础,以去中心化的方式,对大量数据进行组织和维护,用户控制自己的数据,打破科技巨头垄断数据的现状。区块链上的数据全部都附有相关人不可伪造的数字签名,区块链还具有完全公开、高可靠性、去信任等诸多优点,可以实现全球数据共享和溯源,使得构建更高规模、更高质量、可控制权限、可审计的全球去中心化人工智能数据标注平台成为可能。
2.2 算力:硬件成本高
在工业领域需要大量的图片、视频输入以及场景训练,需要极大的运算量,普通人工智能科技公司需要百万以上的资金购置GPU、FPGA等硬件资源,对于大部分中小型企业来说,负担太大。
区块链如何解决:把分布式挖矿与人工智能结合,将大型GPU或者FPGA服务器集群、中小型企业闲散的空余GPU放服务器以及个人闲置GPU作为计算节点,利用区块链技术通过共享算力,为人工智能提供算力供给。
2.3 算法:人才短缺,研发进度缓慢
算法是逻辑的表现,目前的困境在于缺乏专家,一个博士生大概需要五年的时间培养,但是五年前还没有博士生开始从事深度学习,所以该领域的专家极度稀缺。
区块链如何解决:搭建发布机器学习任务的平台,利用群体智慧优化人工智能算法,一套算法由多个人工智能专家更新维护,不再是由一家公司决定一套算法。
3区块链+人工智能行业整体分析
区块链+人工智能类项目按照涉及的领域,分为数据类、算力类和算法类项目,概括如下图。
3.1区块链+人工智能行业项目一览
根据CoinMarketCap数据,截至2018年7月24日14:00,在区块链中的AI概念板块中,项目市值排名主要集中在130-270名之间。
3.2 区块链+人工智能赛道市值与总市值关系
2018年1月1日至2018年6月1日,在区块链+人工智能行业中,根据非小号统计,一月有1个主流币上了交易所并且统计了市值,有1个主流币上了交易所没有统计市值,有7个主流币没有上交易所;三月份有4个主流币上了交易所并统计了市值,有4个主流币上了交易所没有统计了市值,有1个主流币没有上交易所;六月份之后,主流币种都上了交易所并统计了市值。
图4 AI赛道市值与总市值关系(亿人民币)
数据来源:非小号
项目市值信息不完全,但是根据六月份之后的趋势可以判断,随着区块链总市值在下降,AI概念板块的市值也在下跌,如图4所示。
4区块链+人工智能类项目
本章对代表性的区块链+人工智能项目进行技术分析。
4.1数据类项目
数据服务涉及到数据来源、数据存储、数据安全保护及防数据造假、数据清洗标注。
1)数据来源:为保证用户隐私,所有区块链+AI项目中的数据来源均是用户、或者机构自主提供,而非网络爬取。
2)数据存储及交易:解决方案可概括为利用区块链的分布式特点,采用分布式存储方案,对于提供存储能力的节点,提供代币激励,个人或单位可以加入网络,成为节点的贡献者,登记并提供节点存储能力,包括容量、接口、存储类型以及相应的SLA(ServiceLevelAggrement)。对于个人隐私数据,用户可以上传到用户本地节点,利用私钥限制访问权限。
3)数据安全保护及防数据造假:目前使用密码学的公私钥技术,验证数据的来源,判断数据提供者的身份,验证数据的有效性。
4)数据清洗标注:结合社区节点的多角色参与,取代人工智能行业中的数据众包平台。
表2列举了数据类项目的对比表。
重点项目分析:
1)Bottos(BTO)
Bottos项目采用数据挖矿的方式实现用户数据变现,用户不是依靠大量的算力投入,只需要拥有所需的测试数据(测试数据可以是方言、一些鸟类的照片或者叫声),就可以获得代币。
Bottos系统构建的数据交换市场,提供了基础的存储服务,可以帮助用户存储一定、短时、少量的数据,数据交换市场为有大容量、长时间存储需求的特殊客户,提供了储存交易市场的购买服务。为获取优质训练数据,Bottos项目采用社区节点多角色参与进行清洗和标注,但是清洗和标注落地方案作为技术保留,在项目白皮书中没有披露。
底层技术通过对当前区块链技术栈的总结,该项目首创积木式动态节点模型,实现动态编排区块链节点,让系统支持不同节点的类型,构成不同的服务网络,实现了分层和模块化构架,如图5所示。
图5 Bottos积木式动态节点
2)AICHAIN(AIT)
AICHAIN希望打破全球数据垄断性壁垒,打造由区块链驱动的人工智能生态系统,让数据资源方、应用开发方、运行平台资源方和用户在这个区块链上自由发布和使用各自的资源和应用,让用户以更低的技术门槛和成本将AI应用生态建设到区块链平台之上
资源分享平台示意图如图6所示。
分享平台存在着两个技术落地的难题,一是链上资源如何能安全保存,二是如何撮合资源所有者和资源需求者交易。
图6 分享平台示意图
4.2算力类项目
算力类项目涉及算力交易以及算力分配。
1)算力交易:公链中的节点通过安装挖矿软件及基础人工智能运行环境,参与算力的贡献,然后算力购买方与算力出售方通过任务竞价等模式进行交易。
2)算力分配:区块链本身是分布式的计算资源,算力分配的做法是将计算任务拆解分配给大量计算机并行计算。
重点项目介绍:
1)DeepBrainChain(DBC)
深脑链通过智能合约在交易平台上进行算力交易,运用动态计算协同计算节点,通过利用闲置计算资源降低成本。算力分配模式采用采用竞争部署挖矿,如图7所示,优点是节点分散、去中心化程度高。但是算力分配技术细节,该项目并没有披露。
图7深脑链挖矿节点架构
2)Hadron.Cloud
通过AI浏览器进行算力交易,出售算力获取Hadron代币。
Hypernet的算力分配是通过在blockchain层下面创造新编程模型,解决连续通信进程计算有关的问题。
在目前区块链行业里,用全新的区块链协议有效支持百万级的任务分发和协作,是一个新颖的做法。
3)Hypernet
Hypernet没有提及如何进行算力交易,项目着重介绍了算力分配的安全保护机制,为促进算力买卖双方之间的交易,设计了ProcessReplication(复制过程),这可以确保计算过程的损失不会影响到整个作业。当peer的一组被分配相同的一种数据时,各peer可以通过hashing的运行结果,保证任何参与人不会被骗。
这种过程跟ProofofSpacetime(已使用在其它分散式项目)一样的结构。
Hypernet软件基础架构包括三个主要组件组成:BlockchainResource Scheduler、基于分散平均分配规则的API、Hypernet的运行环境。
图8 Hypernet软件基础架构
4.3算法类项目
算法项目技术模式包括:
1)改善算法:公链系统上模型不是最优的,区块链中的每一个节点都可以为算法调参,即利用群体智慧改善现有的人工智能算法;
2)交易平台:构建AI算法交易平台,交易的标的可以是算法需求、算法模型或者将算法模型封装好的AI Dapps;
3)改善区块链:当前区块链设计固定,区块链参数不能灵活调整且智能合约,不能自动判断交易模型的合理性,利用人工智能算法动态更新区块链参数,让区块链系统实现自我进化,并自动嗅探交易漏洞,实现合约交易的文明化进程。
表4列举了算法类重点项目对比表,
重点项目介绍:
(1)Cortex(CTXC)
Cortex公链不能改善算法,算法交易的模式是构建一个机器学习平台,允许用户在平台上发布任务、购买算法模型,Cortex通过将训练后的最先进的机器学习模型放到公链上,解决模型的链上推断共识,利用人工智能算法实现区块链进化。底层技术愿景包括:
第一点是链上推断共识,高度去中心化,所有节点根据经过训练的AI算法模型的推断结果而不是其他共识机制下得出的确定结果达成一致,从而保证了去中心化的区块链自治。
第二点是构建虚拟机CVM,兼容以太坊的虚拟机,CVM指令集完全兼容EVM,同时CVM还支持推理指令。指令的输入是推断的代码,输出是推断的结果。
第三点是AI智能合约,这部分相较于普通的智能合约,AI智能合约涉及推理指令,是整个区块链体系的重点,架构图如图9所示,要求所有节点在推断结果的结果上达成一致。Cortex后期脱离以太坊的构架,销毁ERC-20代币,采用Endorphins,模拟以太坊中Gas的概念来做AI智能合约计算耗费的记账,并命名为Endorphins,以此作为CVM在显卡级别的计费方式。相对于同类AI项目,技术的创新点为:项目在技术架构上创新提出链上推断共识;有自己的虚拟机且相对于以太坊的虚拟机而言,增加了支持推断指令的设计;后期脱离以太坊的构架,采用Endorphins作为计费方式且设计科学合理,可实现性较强。
图9 AI智能合约推断
(2)SingularityNET(AGI)
SingularityNET(AGI)通过建立一个针对AI的去中心化开源平台,实现改善算法的目的,平台循环模式图如图10所示,让AI算法的提供方和使用方实现实时灵活的沟通交流。算法交易部分通过跟踪哪些算法正在被使用,并相应地对开发人员进行补偿。项目没有涉及改善区块链的部分。
底层技术创新点:前期采用POW+POS共识机制,未来脱离以太坊后,采用POR(ProofofReputation)信誉共识机制。该机制包含以下因素:股权、在网络中的整体活动、特定评级方面、活动长度和特定阈值以上的评级等。基于贡献和行为计算节点的可信度,同时利用算法的随机性保证公平性。
与同类的项目相比,SingulaityNET项目并不定位于AI领域的公链搭建,而是致力于开源的AI算法平台的建立和社区的建设,这使得该项目具有极强的可实现性。团队本身也处于AI领域的前沿,母公司的OpenCog基金会背景使得项目具有极强的吸引力。总体来看,容易落地。
图10 SingularityNET开源平台机构图
4.4项目投资明细
根据CoinMarketCap,区块链+AI项目发行时间集中在2017年前后,投资机构既有老牌传统机构如微软等,也有专注于区块链的投资机构如节点资本、比特大陆等,图11列出了市值前9的区块链+AI项目。
图11 人工智能项目投资明细
5区块链+AI项目投资逻辑
从技术角度出发,区块链+AI项目的投资逻辑将从数据、算力、算法层面进行分析,技术方向的关注重点如图12所示。
图12人工智能领域投资逻辑关注重点
5.1 整体逻辑
1)AI和区块链的投资趋势,是由区块链引发的,因此一定不是AI领域单边的需求,因为那样的话就会回归AI领域的投资逻辑。我们需要探索交叉领域给双边带来的机遇,以及创造全新的机会。
2)人工智能市场并不是一片蓝海,BAT等巨头公司资源,技术优势非常明显。初创企业在长尾众包市场机会可能大一些。比如未来去中心化的算法交易市场可能更易落地,用物质奖励,来刺激机器学习专家开发模型,性能最好的模型会获得更高比例的收益。
3)要让去中心化的AI市场起作用,就需要运用各种安全计算技术,包括联合学习等,保证个人和公司提供的任何模型参数都能以完全私密的方式来处理。
4)目前创业要充分考虑到熊市的影响,已经有一定进展和实力或具有赚钱能力的项目才能安稳度过熊市,比如项目主网已经上线、已经有实际业务现金流等。
5.1 数据
这一领域初创公司可以通过数据众包的方式,利用token的优势进行弯道超车。
1)数据保密:由于数据读写方面,区块链仅支持记录级写授权,但读操作时完全共享,这种情况导致链上数据完全共享,因此数据的保密性很重要。
2)规模化存储节点:项目前期应该能吸引大量的储存节点,以降低数据存储的成本的项目。
5.2 算力
目前这一领域巨头公司优势明显,在目前的发展情况下,初创公司突破较难,等算法市场、存储市场等生态起来了以后可能会有新机会出现。
1)AI芯片研发:英特尔垄断了芯片,芯片是人工智能算力的硬件基础,这类项目投资者需要关注项目方是否有能力研发并生产芯片。
2)并行计算:算力分配需要考察各个客户端能否将提交的算法进行聚合修改,保证算法参数实时有效的更新在每一个客户端,是目前AI算力分配过程中遇到的难点,所以投资者需要关注项目方是否有能力处理大规模并行计算难题。
5.3 算法
1)算法保密:去中心的AI算法交易市场,让每个AI人才都可以为算法做出贡献,但是要让去中心化的AI市场起作用,就需要保证个人和公司提供的任何算法模型都能以完全私密的方式来处理。
2)同步模型参数:分布式网络协同训练人工智能模型时,参数需要通过共识机制协同调整,如果模型参数不一致,最终的算法模型可用性非常低,所以此类项目投资者需要关注项目是否能做到同步模型参数。
6区块链+AI项目未来趋势
6.1技术总体趋势:此领域成熟还有大量条件待满足
理想情况是:利用合理的Token模型构建底层价值网络,保证区块链节点的积极性,在区块链的隐私,性能,硬件,算法安全性提高的前提下,越来越多的数据,算力,算法,新理论在市场上进行交易。同时进行自我优化。
6.2 隐私:首要因素
ai相关的数据和计算的隐私,在云计算时代未得到彻底解决,区块链时代是一个大的机遇。因此应关注隐私方面的进展。
6.3 经济模型:给予角色正确的激励
区块链+AI项目中包括数据的提供方和购买方,算力的提供方和购买方,算法的提供方和购买方。如何协调AI生态中各种角色的经济激励,使更多的数据、算力和算法在平台上交易,甚至贡献新的理论,是值得研究的课题。
6.4 扩容:更好的解决方案
随着区块链扩容方案的落地,目前AI+区块链中使用的各种算法可以有更智能的解决方案。
6.5 存储:未来会出现更好的垂直性储存。
在训练AI模型的过程中,为了训练属于自己的模型,需要存储自己的数据。目前IPFS方案的落地可能性众说纷纭,一种可能性是,会出现专门应用于人工智能领域的数据存储协议,针对ai计算所需的隐私要求和存储pattern做的专门的优化,有些场景下比通用存储可能会先出现落地应用。
6.6 硬件:期待专用芯片的出现
矿工一直在做的就是简单的SHA256的哈希运算,但深度学习还是以GPU通用计算为主,而且深度学习训练的算法本身不是确定的,因此目前挖矿硬件是难以支持深度学习训练的。未来期望会出现满足ai+blockchain各种需求的专用芯片,配合专门的协议,可以解决均等分配计算任务的难题,使得在矿工在挖矿给区块链记账的同时,帮助解决AI计算问题。
6.7 AI算法安全性趋势
AI算法如果架构在去中心化的区块链上,随着AI被用在各种区块链上的越来越重要的场景,如果会出现没有任何一家公司完全控制算法,算法存在失控的可能性,因此,AI行为安全一定会变得越发重要。
7参考资料
Cortex白皮书
SingularityNET白皮书
DeepBrain-Chain白皮书
Cindicator白皮书
Bottos白皮书
NEBULA AI白皮书.
AICHAIN黄皮书
ATN白皮书
Alphacat白皮书
MATRIX技术白皮书
PROJECTPAI白皮书
更多内容请扫描下方二维码