爱吧机器人网 » 专题 > 观点 > 正文

人工智能、数据隐私与区块链的协同效应

译者在原文基础上做了适当补充修改,以便理解。

基于区块链的数据交易市场会为机器学习带来很大变化,由区块链数据建立的模型有可能创造出世界上最强大的人工智能。这一数据市场结合了两个最有力的元素:

一、机器学习中涉及的隐私信息——可以在不透露私人数据的情况下进行数据整合建模,
二、基于区块链的激励机制——这些机制能有效吸引更好的数据和模型,并使整个系统更加智能化。

其结果就是整个数据市场更加开放,人人都可以出售自己的数据并保护自己的隐私,同时开发者可以激励用户吸引更好的数据源来调整算法。

建立这些系统非常具有挑战性,对区块生成有各种的需求,不过最简的系统版本已初具规模。相信这些交易市场会把我们从一家独大的互联网2.0带入到开放竞争的互联网3.0,并且数据和算法都将被货币化。

起源

这个想法可以追溯到2015年,Numerai对冲基金的Richard将一份加密数据信息发给一群数据专家,让其对股市建模并相互比拼。之后挑出好的模型进行整合,按照整合模型做股票投资,并对预测准确的人进行奖励。
数据专家之间竞争就像一个完全的去中心化系统,整合模型就是使系统可以应对任何一类问题。

建模


我们以去中心化交易所上的加密货币交易为例,为其建立一个完全的去中心化系统是常被提及的问题:

数据:数据提供者将数据权益化,并提供给建模者。

建立分组模型:建模者挑选数据并建模。通过一个加密的计算方法进行数据模拟和模型拟合,模型可以在不泄漏隐私信息的前提下被调整拟合。同时模型也被权益化。

整合模型:通过一个算法整合分组模型,变成一个元模型。每个分组模型的权益会被算法采纳。建立元模型与否可以按照不同情况自行抉择。

使用元模型:在一个去中心化的链上交易系统中,智能合约可以通过程序运行元模型并进行交易。

去中心化的收益和损失:对模型进行一段时间的检测,交易会有盈亏。盈亏取决于每个参与的模型是否足够优化。预测较差的模型所占权益和资金将会被部分或全部去除。其数据提供者的权益和回报也会被相应削减。

 可验证的计算过程:每一步的计算过程或者是中心化并可验证的;或者是去中心化,利用安全的多方计算来实现。

数据托管:因为链上存储的成本很高,数据或模型可托管在IPFS上或安全的多方计算网络上。   

强有力系统的保证

吸引优质数据

吸引优质数据是这个系统中最有效的部分,因为数据往往是大多数机器学习的限制因素。用同样方法,比特币通过开放式激励机制和恰当的数据激励结构,创建了一个全球计算能力最强的应急系统。这将为各类的应用程序带来源源不断的优质数据源。

算法竞争

算法和模型的开放性竞争史无先例,想象一下新闻栏背后的数千种算法带来的多样性。

回报透明

数据和模型提供者可以得到公平的回报,因为所有参与的过程和模型都是可验证的,透明的回报机制提高参与者的积极性。

自动化

链上的操作直接用代币反应价值,这是一个自动的、无需相互信任的闭环。

网络作用

由用户、数据提供者和数据科学家组成的网络,使这个系统更加强大。网络作用发挥得越好,越多资金会聚集在这个领域,相应的数据回报率会越高,这将吸引更多优质数据源和优质数据模型,循环往复。

隐私保护

除了以上所述,隐私保护是区块链带来的一大变化。
提供用户数据分享的选择权,
防止数据和模型的经济价值被他人占有。
如果任由数据、模型不做链上加密,则会被其他用户任意拷贝使用,占用创建者应得的经济回报。
有一种间接的解决方法是私下出售数据。即使购买者选择转售或出租数据,数据的价值随时间推移而减少。这个方法把数据的应用限制在短期使用范围,而且仍然会产生隐私问题。因此使用安全而强大的计算形式尤为重要。

安全计算

安全计算允许模型对数据进行拟合但不会泄露数据本身。目前使用和研究的安全计算有三种主要形式:同态加密(HE),安全多方计算(MPC)和零知识证明(ZKPs)。多方计算目前最常用于私人机器学习,因为同态加密过于缓慢,而如何将ZKP应用于机器学习还不明确。安全计算方法正处于计算机科学研究的前沿。它们通常比常规计算慢几个数量级,是系统的主要瓶颈,但近年来一直有进步。

终极推荐系统

为了说明隐私保护的机器学习的潜能,我们来试想一下一个“终极推荐系统”。系统会记录你在设备上的所有操作,包括浏览记录,应用操作,图片,位置数据,消费记录,可穿戴设备,相机和AR眼镜。基于这些信息,这个系统可给你推荐相应的产品。
这个推荐系统将会非常有效果。因为它的数据量比任何一个网站都要多,而且信息分类细化,大量的私人信息通过区块链加密使隐私得到保护,同时机器学习通过模型模拟得出对个体的立体分析。类似于之前的加密货币交易系统,它可以让不同领域的模型,例如网址推荐或音乐网站,通过竞争得到个人的加密数据,在保护隐私的前提下建模并作出产品推荐,甚至可能支付给客户相应的数据费用。

现在的解决方法

下图介绍了来自Algorithmia Research (https://algorithmia.com/) 的一个简单方案:用户将数据样本、回报、和模型绩效指标发布在智能合约中;人工智能算法工程师下载数据样本并建立数据模型,将最优模型返还给智能合约;如果模型的最终测试结果达到预定指标,工程师会得到相应的回报。


Numerai (https://numer.ai) 的模型则更进一步:使用加密数据(尽管不完全同态),整合分组模型到元模型,并根据未来的表现(本例中是未来一周的股票交易表现)来作出激励,而不是根据已经发生的信息(即回溯交易表现)。但现阶段数据仍然是中心化的,且重要因素的选取仍受建模者的主观想法限制。

当其他人仍在致力于建立安全的计算机网络时,Openmined (https://www.openmined.org/) 已经在创建一个可以拟合训练机器学习模型的多方计算网络。一个好的最终状态是将相互拥有元模型,它使数据提供者和建模者的所有权与其模型贡献相联。这些模型将被代币标记化,随时间推移可派发股息,甚至可以任参与者支配。这是一种互相拥有的蜂巢式结构,Enigma (https://enigma.co/) 和HumanAI (https://humanai.co/)也有类似的设置。





如何达到最好的结构

我无法准确的说清怎样才是最好的系统结构,但对此我有些许想法。

我曾写过一篇评价区块链的论文:在一个光谱系列中,有基于物理原生、基于数字原生、和基于区块链原生,若区块链原生越多,系统结构越好。区块链原生越少就需要大量可信任的第三方机构,这会增加系统复杂性并减少与其他系统互建模块的易用性。

这意味着如果创造的价值可以量化,系统就更有可能被优化——理想情况下直接以货币形式,更好的是以代币形式。这将创造一个干净的闭环系统。将之前介绍的加密货币交易系统与识别X射线肿瘤的例子作个比较:在后者中,你需要说服一家保险公司X射线模型是有价值的,谈判如何有价值,然后信任一小群身在现场的人,让其来证明模型的成功/失败。

这并不意味着对社会用途而言,数字原生的好处不存在。像之前提到的终极推荐系统就非常有用。如果说到信息挑选市场Curation Markets*,那就是另一种应用,模型在链上程序化操作,系统用代币作为激励回报来管理市场,以此创建一个干净的闭路。虽然现在看来基于区块链的运用还很模糊,但随着时间推移应用会越来越广泛。

启示

首先,分布式、去中心化的机器学习市场可以消除现有科技巨头对数据的垄断。在过去的20年中,他们将创造网络价值的资源标准化、商业化——专有数据网络和强大的周边效应。结果,所创价值使收益从数据转移到算法。


换句话说,他们为AI创建了一个直接的商业模式,用数据饲养并训练它。

其次,他们创造了世界上最强大的AI系统,通过直接的经济激励为他们吸引最好的数据和模型。他们的力量通过多方面的网络效应而增强。互联网2.0时代,网络数据垄断变得商品化,这似乎成为下一个起点的理想选择。

第三,正如推荐系统的例子所示,搜索被本末倒置了。搜索变成产品和竞争对人的追逐,而不是用户搜索产品。每个人都有个人偏好,推荐系统通过竞争将最相关的内容放入信息栏中,其相关性由每个人自己定义。

第四,用户能够从Google和Facebook等公司使用机器学习服务中获得同等好处,而不会泄漏隐私数据。

第五,机器学习领域能够有更快的发展。一个广大的数据市场对每个工程师开放,其受益群不再局限于一部分大公司的工程师。

挑战

首先,安全计算方法目前进展非常缓慢,而机器学习的计算成本已经很高。另一方面,对安全计算方法的市场兴趣已慢慢出现,算法本身性能也在不断提高。我看到过去6个月内HE,MPC和ZKPs有显着性能改进。

计算为元模型提供的一组特定数据或模型的值很难。

清理和格式化分组数据具有挑战性。我们很可能会看到一些工具、标准化和小企业的组合,他们可以解决这个问题。

最后,具有讽刺意味的是,创建这种系统的广义商业模式不如创建个体实例那么明确。似乎会带来很多新的加密原语,例如信息挑选市场Curation Markets。

结论

私人机器学习与区块链激励相结合,可以在各种应用中创造出最强大的机器智能。随着时间的推移,可以解决重大的技术挑战。他们的长期潜力是巨大的,并且从大型互联网公司对数据的垄断中受到欢迎。他们也有点可怕——他们引导自我存在,自我加强,消费私人数据,且几乎不可能关闭,这让我怀疑是否创建它们会比以前更好。但无论如何,它们是加密货币缓慢却突然进入每个行业的一大例证。

*Curation Markets是指社区内借助token让用户对其内容进行整理组织,这个制度将信息选择权利归还给了用户。用户把自己的利益跟信息流的质量绑定在一起,大家通过投票选出最优质的算法。

本文意见仅供参考,不构成投资建议。据此入市,风险自担。


上一篇:人工智能必将威胁我们的文明
下一篇:为什么AI不是万灵药
精选推荐
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

本周栏目热点

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

[1970-01-01]    从首尔清潭洞SM娱乐公司大楼代表办公室的落地窗可以清晰地眺望对面的汉江。李秀满会长介绍拥有代表办公室和录音室的建筑物是工作室中心 ...

[1970-01-01]    虽然我国经济增速下降,通缩若隐若现,但由于我国劳动力人口在2012年已经达到顶峰,之后总量呈逐年下降之势,所以即使近几年产业工人工 ...

腾讯思享会:探讨智能社会与人类未来

[1970-01-01]    人类在享受开车的过程时,在不久的将来可能让机器开车,人类如不是理性的控制机器人,又将一场持久的大战。  以智能社会与人类未来为 ...

[1970-01-01]    机器人发展到今天到了重新定义的时候,机器人拥有人类的感知和思维、应用到更多领域,成为现代机器人产业发展的新方向,由此看出中国机 ...