注册
关闭
区块链大帝

区块链大帝

发布于 4周前 阅读数 2559

对话波卡的隐私计算原力Phala:隐私计算是Web3时代的新刚需

前言:「WebX实验室」始终在尝试一件事情,即作为业态观察者,将Web 3.0从Gavin Wood的一个前瞻性设想,梳理成一个系统且具象化的故事。在一个更清晰的主线下,串联区块链发展的碎片,让更多的人更好地理解去中心化网络时代以及它正在如何到来。

【为什么对话Web3世界?】

「WebX实验室」认为,Web3.0的愿景需要由数量庞大且多元化的波卡生态项目共同协作完成,因此我们希望通过与这些生态(尤其是波卡生态)中的优质项目展开长期性对话和沟通,借助这些“开荒者”的视角,来构建一个更加丰满和深刻的Web 3.0全景图。

今天我们请到的是波卡生态的隐私基础设施——Phala Network,其也是首批加入Substrate Builders Program 计划以及第一批Web 3.0训练营15个核心成员之一。而就在WebX实验室完成了此次采访后,Phala Network就正式对外宣布完成了一次千万美元估值的战略投资,投资方包括 Candaq Group、IOSG Ventures、SNZ、水滴资本、币世界、瑞新资本、无极链、株式会社 Incuba Alpha、Exoplanet Capital 和 Blue Mountain Labs等知名机构。

基于这次对话,我们发现,在Web 3.0的时代,隐私计算很可能会成为一种新的“刚需”。

对话波卡的隐私计算原力Phala:隐私计算是Web3时代的新刚需

Phala:果报,佛教术语,与之相对应的是Karma,因位,也就是因果关系,Phala更希望一切因果能够实现足够的确定性,输入确定的因,那么在此之后发生的果也是确定的。 

 

什么是隐私计算?

 

a.隐私计算最早在2016年被提出,其指的是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。简单来说,就是从隐私数据的产生、收集、保存、分析、利用、销毁等环节中对隐私进行保护的方法。

b.外界容易将可信计算和隐私计算混淆, 可信计算是指计算结果本身是非常可信的。从某种意义上来说,区块链也是一种可信计算,链上公开透明不可篡改的数据,经过智能合约的计算,其产生的结果是可信的。Phala的核心解决方案TEE也是可信计算的一种技术方案。

 

隐私计算为什么会存在?

 

a.数据作为Web 3.0 时代的生产要素越来越重要,大数据被纳入新基建,与此同时,根据Statista报告显示,2020年全球大数据市场收入规模将达到560亿美元,是2016年的两倍,未来大数据市场将呈现稳步发展的态势,预期增速将达到14%左右。涉及大量个人隐私的数据成为一种新的矿藏资源。

b.现实是这些隐私数据遭到了愈演愈烈的滥用。隐私数据被过度集中,风险被聚焦;为了保证性能,又没人愿意对数据进行完善的加密处理;各家守着自己的数据“金矿”,形成了一个个数据孤岛,根本无法发挥大数据本来的价值。

c.大数据本质上是处在一个个不同的主体之中的小数据,彼此之间就像数据孤岛,只有这些小数据孤岛真正产生协作,才能成为真正有价值,作用于业务的大数据,但这些小数据产生交互的过程是极为不安全的,第一,数据中涉及的隐私或者商业信息的安全需要依赖某一个机构不作恶。第二流转过程可能会出现泄漏和丢失。第三,由于未来数据的价值越来越重要,甚至成为一种资产,因此出于利益原因,各数据主体方对交出数据这件事极为谨慎和抵制。

隐私计算是联通数据孤岛的隐形桥梁,只有隐私计算的落地才有可能让小数据成为广域的大数据。兼顾隐私保护和数据利用的计算方式就成为了企业和学界研究的重点,各国对于隐私数据的监管越严厉,隐私计算行业的发展前景就越大。

 

Phala解决了什么痛点?

 

Phala Network 是一个基于区块链与 TEE 技术的隐私计算协议。Phala 利用保密智能合约,让数据的收集、管理、授权分析等变得无需信任。

Web 3.0世界中的隐私悖论

原本区块链公开透明被当成是一种技术优势,但是现在反而出现了隐私计算(例如匿名币)的需求,这是一种倒退吗?

a.首先数据分为两种,第一是流通数据,像国家统计局数据、上市公司财报等等,这些需要公开透明且不可篡改。第二是生产数据,也就是那些商业数据、个人隐私等,这些是不可公开的,利益相关者也不想公开。

b.但为了去信任化又需要生产数据上链存证,这里就存在一个让很多区块链应用和想法无法落地的悖论。如何保证数据是隐私的,同时保证数据可以上链且真实。解决办法就是隐私计算,一方面基于硬件解决思路的Phala能够保证链下采集上来的数据是可信的,同时保证数据是以一种始终加密的状态来到链上,且在需要调用数据时也能保证其是经过加密保护的。

这种“悖论”是Phala需要去解决的问题,也是项目进入这个领域的机会点。

 TEE在隐私计算上的优势是什么?

 

TEE的通俗化理解:一般来讲我们用沙盒来隔离病毒这样作恶的程序,使之无法对外界产生坏的影响。而TEE恰恰相反,TEE就像一个黑盒,盒外的一切都无法影响盒内的事物。

a.TEE的存在很普遍,大部分设备都具备这样的硬件环境。

b.技术体系和配套服务非常成熟,Intel从2016年就开始开发TEE这样的技术。当前主流的TEE技术有Intel SGX、ARM TrustZone、AMD SEM/SEV等。

c.作为硬件解决方案,它能够实现链下可信计算,在某种程度上解决了数据上链前的真实性。

 

TEE的短板在哪里,又为什么选择它?

 

短板:TEE在区块链行业很不受欢迎,原因在于,你仍然需要将信任寄托在一个中心化厂商开发出来的中心化解决方案上。

选择的原因:即使TEE作为隐私计算的硬件方向,存在一定的漏洞,但隐私计算领域,引入硬件是一种常态:

a.选择TEE是一种实现实用化的策略,在当下实际的场景中可能会产生更大价值

b.TEE是性能和安全性两个端点上一个不错的平衡点。从用户体验出发,性能和安全并不能完全兼得,安全性极度高,那么性能以及所能感知的体验就会极度地差。当前的性能和安全性已经足够满足用户需求。

 

隐私计算中,TEE与多方安全计算的区别?

 

隐私计算当前主要的技术路线有3种,TEE、多方安全计算(MPC)以及联邦学习。

a.多方安全计算:简单来说就是,在针对无可信第三方情况下,安全地进行多方协同的计算问题。即有一件事,需要大家各自提供手中的数据来进行一场计算才能得出结果,在MPC方案中参与计算的各方手握各自的数据,共同且秘密地输入到一个函数中,大家都能拿到基于数据的准确计算结果,但在这个过程谁也不能拿到其他各方输入的隐私数据。

b. TEE核心是构建一个硬件安全的本地黑盒空间,重要数据的计算仅能在这个黑盒子中进行。

c.联邦学习:是一个分布式的机器学习技术,就是大家共同建一个AI模型,然后不断训练这个AI模型,以达到安全性保障。

 

今天主要对比MPC(多方安全计算)和TEE这两个方向:

a.性能:MPC(多方安全计算)不能承受高复杂度的多方计算,例如相比于计算1+1=2这类参与方少且成分简单,并不能承受1万人规模这样数据协作。

b.通用性:MPC不适用于更加复杂的函数,一旦脱离简单的计算,MPC就会极度消耗性能资源。并且,每一次不同类型的MPC的函数都需要对应一个特定的混淆电路,相当于每做一次新的计算都需要重新开发一个相应的混淆电路,无法应对多类型的隐私计算需求。而TEE则拥有更高的通用性以及对复杂隐私计算的承受能力。

总体上看,基于TEE技术的Phala Network相比于业内其他隐私计算项目最大的优势就是“性能”和“通用性”或者说“普适性”。

 

 Phala相对其他隐私计算项目的区别是什么?

 

a.相比于国内基于MPC路线的项目ARPA、Platon,Phala的主要应用场景是通用型的隐私计算。ARPA这类项目会更加适用于那些大型金融机构,其场景更注重加密强度,隐私计算的需求类型也比较单一。Phala可以适配绝大部分应用场景的需求。

b.复合性的安全性结构设计。Phala将共识层和计算层分开。共识层采用了类似波卡的验证人的选举制度,负责维护网络的安全性,计算层不会影响网络安全。此外Phala将会建立一个数量足够多,覆盖足够广的TEE矿工池,链上的隐私计算任务可以通过随机的方式分发给矿工池中某几个人。第一矿工并不能知道正在运算的数据内容,第二,由于矿工选定是随机的,因此外界无法通过物理攻击的方式来进行破坏。但即使这样,外界也无法获取其中的数据。

Phala在运算TEE矿工之外又设置了在线TEE矿工的角色,通过这种激励方式,让Phala的TEE随机池始终能够保持在一个较大的状态。

 

隐私计算现在有没有好的落地方向?

 

Phala此前已经推出了Web3.0 下的数据收集解决方案——Web3 Analytics(简称W3A)。W3A 是一个去中心化的数据收集、分析和交易平台,可以作为 Google Analytics 的去中心化升级,帮助 Web2.0 与 Web3.0 应用以极低的成本接入 Phala Network 数据交易市场。

简单来说就是用户、开发者或者数据分析师可以通过W3A的SDK工具来收集网站或APP数据,用户层面他可以掌控自己的隐私数据,从开发者数据分析师层面来讲,他们不用知道这些隐私数据的具体内容是什么,仍然可以基于Phala的隐私计算网络去做相关的统计和数据分析。

W3A从数据生产端就通过SDK的方式实现,上传即加密,当数据被调用,用户都会收到解码授权请求,最终是要实现数据权利的三权分立。

数据所有权:从物理上保证数据所有权只归属于用户本人,此处关键是隐私保护。

数据计算权:计算权力通过区块链保障由授权系统强制执行,因此归属机密智能合约(Phala网络的目的就是运行机密智能合约)。

数据使用权:由权限系统流转,用户授权开发者则第三方可以使用被授权的部分。

这个如何实现?

第1, W3A提供Web、移动SDK:某个网站所有者可以接入W3A SDK,通过端到端加密后实现埋点上报。此处可以保证:私钥只有用户本人和TEE矿工设备所有,开发者和我们都无法对数据进行解密

第2, 去中心化用户数据管理:用户可以通过私钥签名,进入W3A控制台管理数据和及其访问权限。他可以删除、下载一切自己的数据

第3, 对于想使用数据的第三方:他可以通过模板化的W3A合约、或者自定义SQL提交为Phala网络的机密智能合约,这些计算合约会去查询用户是否用私钥签名完成授权了,如果完成了授权,这段分析程序就会在TEE内完成数据分析,并将结果数据展示给开发者。这个步骤中,无人可见数据,但是又能看到整套流程和数据是可信的

 

波卡对Phala的价值是什么?

 

a.对于Phala来说,波卡是一个很好的连接器。它所带来的业务上的组合自由度能够激发生态中的集聚效应,DeFi的成功很大一部分原因就是它在组合性上的高度自由,同样的Phala可能作为一种功能拼图或者资源连接各种需要隐私计算的项目。

b.这种组合性和集聚效应会带来大量的用户和业务机会,同样当我需要数据存储的功能,我可以直接使用波卡分布式存储项目Crust的产品,随时随地根据市场需求来调整自身。如果单出地基于TEE技术去开发一条公链,那么一旦有业务组合的需要产生,这种需求就没有办法被满足和实现。

c.Substrate高度的自定义宽容度允许Phala选择最适合自己的一条路。波卡的Substrate能够向开发者提供更加宽泛自定义面板,开发者可以选择项目是用PoS还是用PoW共识。

d.波卡的共享安全性。这一点极为重要,因为对于一个发行了代币的项目来说,如果代币价格持续下跌,那么项目遭受51%攻击的成本就会越来越低,这就对链上正常进行的业务和用户产生了极大的威胁。但波卡的共享安全性设计很好地解决了这一点,波卡本身巨大的共识凝聚力和市值能够帮助一些小项目提升并保持较高的安全性。这种设计在Cosmos上缺失的。

e.波卡在去中心化和中心化上取得了一个很好的平衡,好处在于保证了整个生态的稳定发展。波卡官方在项目推进和前期治理上的风格是十分强硬和中心化的,但第一,我们仍然可以用去中心化的方式去推翻这种中心化的方式。第二点,波卡官方起到了中心化本身应该有作用,发挥了应有的价值,来帮助整个项目处在一个良性的发展路线上。而且实际上的结果也就是波卡的网络最终是去中心化的。

相比于其他封闭性的公链生态,波卡生态不仅拥有更多的外部流量入口,同时在生态内部也能实现资源的内循环,能给Phala带来更多的业务机会和用户。

 

如何理解Web 3.0?

 

Web 3.0的萌芽也不单单出现在Gavin Wood身上,英国计算机科学家蒂姆·伯纳斯·李,现代互联网之父,在现代互联网30周年对其当前现状的极度不满,他认为当今的互联网已丧失最初的精神。

蒂姆·伯纳斯·李甚至开发了开源去中心化网络平台Solid来试图对抗和改变如今的互联网。他认为,如今数以亿计的互联网用户必须将个人数据「免费卖给」中心化巨头,才能获得互联网便利,这不符合用户的最佳利益,这是一种不公平、不对等的价值交换。在这个平台上,用户的照片、个人健康等个人数据都可以存储在Solid POD 中(POD 是:Personal Online Data),等于自己有了一个隐私数据服务器,然后只有授权过的人才能读取和调用用户的个人数据。

蒂姆·伯纳斯·李认为数据赋予个人权力,是下一个网络时代成功的根本。这种理想早就存在,但直到区块链技术被真正封装打包出现后,才让蒂姆·伯纳斯·李的设想得以实现。但此时,区块链从中起到的作用并不是常说的不可篡改,而是去信任化。Solid POD 可以证明「数据是你的数据」,无需第三方。这里区块链起到的作用更多的是无许可,这通常会被人忽视。

回头开来,区块链只是Web 3.0的一部分。它的最终到来还太过遥远,它将会由众多的技术和应用去共同推动和填充。例如区块链、密码学相关就在产生一些新的创新。Web 3.0的未来可能以为这更多的智能化、自动化和自由化,例如现在金融和区块链的结合让人们能够实现金融层面的自由。

 

【WebX实验室观点】

可以预见的是,在Web 3.0的时代,云计算,移动互联网(物联网),人工智能,区块链,这些技术要素和数据要素一起互相联系并且深度融合,是产业发展的必然趋势。但眼下生产关系上的落后已经影响到生产力的发展,例如,大数据原本应该发挥更大的作用,甚至能催生出更多的经济增长机会,但大数据的生产关系是落后的,也就是大数据应用和用户隐私意识以及数据确权的冲突,这些对于这个行业来说一个阻碍,这就是隐私计算最大的机会点。

而隐私计算全面渗透到用户层面还存在很多问题和很大难度,隐私保护的法律体系、用户隐私意识崛起以及不可阻挡的大数据应用市场需求会迎来一个极为强烈的冲突期,隐私计算以及相关的密码学将会被迫继续向前演进,但就是这样的冲突,使得隐私计算一定会成为未来的新刚需。

本文链接:https://www.8btc.com/media/643521
转载请注明文章出处

  • 0
区块链大帝
区块链大帝

0 条评论