(CWW)隐私计算作为一种助力实现“数据可用不可见”的关键技术,在近几年受到了越来越多的关注,相关技术产品百花齐放、行业生态建设如火如荼。从技术发展的角度看,隐私计算之所以如此火热,主要在于它改变了传统的数据流通形态,增强了数据流通的可控性,在一定程度上回避了数据权属与安全保护争议,为数据要素流通提供了新模式。


(资料图)

在推广隐私计算落地应用的过程中,不同技术厂商提供的产品和解决方案在设计原理和功能实现之间存在较大差异,使得部署不同技术平台的数据流通参与方之间无法跨平台完成同一个计算任务。为实现多个合作方之间的数据融合,用户往往要付出极高的沟通成本以协调产品选型方案,甚至不得不部署多套产品以逐一适配,造成重复建设。

作为促进跨机构间数据共享融合的关键技术,隐私计算有望成为支撑数据流通产业的基础设施,但高额的应用成本不利于隐私计算技术的推广应用,解决不同产品之间的技术壁垒,实现隐私计算跨平台间的互联互通已成为产业内的迫切需求。推进隐私计算的跨平台互联互通需要关注哪些问题和要点?本文拟从以下六个方面展开讨论。

1 隐私计算跨平台互联互通的需求

数据资源只有经过“流通”,脱离了原有使用场景,从数据产生端转移至数据应用端,并在生产经营活动中产生效益,才能真正释放其作为生产要素的市场价值[2-3]。在数据权属界定规则缺失、安全合规风险加剧的当下,众多数据从业者选择隐私计算作为探索数据流通新模式、新形态的突破口。隐私计算已经成为了当前数据流通领域最火热的一类技术,但在技术推广的过程中,不同隐私计算技术平台之间无法互联互通成为了制约产品落地应用的一个关键阻碍。

1.1 助力多方数据融合降本增效的市场用户需求

作为一类助力数据流通的工具,产品的可用性、易用性、好用性决定着隐私计算技术价值发挥的范围和程度。在此前几年的时间里,国内技术提供者们已经在提升产品的可用性和易用性方面取得了一定的进展。根据中国信息通信研究院云计算与大数据研究所和隐私计算联盟工作中的调研交流和产品评测结果,可以发现在算法、算力、硬件的协同优化之下,行业内整体的技术产品性能已可以满足用户业务的基本需求,并且还将持续优化以促进隐私计算在更多需求场景中可用;同时,越来越多的技术厂商可以提供多版本、轻量化等方式来提升用户部署的便捷性,并配合模块自定义、组件拖拉拽等设计来满足用户的个性化需求,提高产品的易用性。

进一步地,在如何提升产品好用性、促使产品与用户实际业务场景友好适配这个层面,隐私计算技术平台之间的互联互通就成为了关键话题。目前,市场上已经发布了近百款隐私计算产品,且仍有许多企业和机构正在研究和开发。而不同产品均有各自特定的算法原理和系统设计,产品之间(甚至同一产品的不同版本之间)的技术差异使得彼此很难兼容、无法互通。因此,参与联合计算的用户只能在部署相同产品的情况下才能实现多方数据合作。为了满足这一条件,单一用户往往要部署多套产品以满足不同合作方的需求,这极大地增加了用户的使用成本,也阻碍了隐私计算技术的推广落地。

1.2 打造数据流通基础设施关键底座的产业需求

跨行业、跨机构的数据融合在金融、电信、医疗、政务、广告营销、智慧城市等诸多场景都有着广泛的需求。但由于国内对于数据流通使用的监管要求趋严,且尚未出台具有指导性的实施细节指引,相关企业和机构参与数据流通时既有顾虑也有困惑,无疑阻碍了数据资源的充分流通,不利于数据要素市场的培育。而隐私计算技术正在以一种不交互原始数据,只流通数据使用价值的方式,推动着传统数据流通模式和流程的变革,有望成为全社会数据流通网络的支撑型基础设施。但是现阶段,隐私计算整体的技术能力和应用模式还不成熟,实现目标仍有距离。

以当前在金融场景的应用模式为例,金融机构往往都需要依靠多方来源的外部数据来支撑其对于诸多业务的风险控制,这些外部数据可能包括专业数据服务商提供的公共市场信息、政府公共部门提供的客户基础信息、征信机构提供的客户征信数据以及运营商、互联网平台、电商平台等提供的更多替代数据等。参与其中的银行、运营商等大型机构很多已经部署或开始试点各自的隐私计算平台,面对多机构之间的数据资源合作需求,往往会在反复沟通后由相对强势的机构要求使用特定的隐私计算平台进行合作。

以此类推,如果在各个应用场景中,合作机构之间都要就使用特定技术产品达成共识,长此以往,市场就会衍生出一个个基于相同的隐私计算平台捆绑形成的小生态,而各个生态之间仍旧相互孤立。那么,隐私计算在破除机构间“数据孤岛”问题后,将催生一个个新的“数据群岛”,与技术本身促进数据流通的使命相背离,无法支撑建立面向全社会的数据流通网络。

因此,隐私计算平台之间的互联互通已成为技术产业进一步发展中亟需解决的问题。

2 隐私计算跨平台互联互通的内涵

解决隐私计算跨平台互联互通问题的核心基础,是理解它的概念内涵。

(1)什么是“互联互通”? 这个概念最早是美国电信领域在1934年提出的,本意是两个通信网络之间是否能够兼容,而在当下这一概念逐渐演变为不同组织、不同场景、不同系统之间在平台“互操作”与数据“可携带”等方面的问题。

(2)互联互通的客观对象是什么? 隐私计算跨平台互联互通的最根本需求来自于部署了不同产品的用户,这里的“不同产品”既可能是不同技术厂商提供的多个产品,也可能是相同厂商相同产品的不同版本。进一步地,与其说是不同产品间互联互通,不如说是用户部署不同技术产品后的一个个平台实例。

(3)互联互通的目标形态是什么? 用户的最终诉求是希望在部署不同产品后,仍可以实现各自持有的数据在不同底层技术平台之前间仍可以流畅传输、交互、融合,协同完成计算任务。因此,隐私计算跨平台互联互通的目标形态是具有不同系统架构或功能实现方案的隐私计算技术平台(包括同一平台的不同版本)之间通过统一规范的接口、交互协议等实现跨平台的数据、算法、算力的互动与协同,以支持部署不同技术平台产品的用户共同完成同一隐私计算任务。相比之下,实践中部分针对多个不同产品之间部署于统一大平台以支持用户灵活选择任一产品执行任务的探索,更贴近于对于不同提供方隐私计算能力模块的集成,而非真正的跨平台互联互通。

3 隐私计算跨平台互联互通的难点

隐私计算技术原理本就复杂,而异构隐私计算平台间的互联互联不仅要能够实现复杂的隐私计算原理,保证平台原有功能的实现,还要提供足够的包容性,考虑到不同平台设计的复杂差异。

3.1 不同隐私计算核心技术路线之间存在天然壁垒

隐私计算并非一项单一技术,而是一个包含多种技术的复杂体系。例如,以密码学为核心原理的多方安全计算类产品、以安全硬件为核心原理的可信执行计算类产品和以“数据不同模型动”为核心思想的联邦学习类产品之间,技术实现的最底层思路就有着天壤之别,这种技术上的差异性为现阶段讨论隐私计算互联互通带来巨大挑战。

3.2 算法的实现方案复杂多样

隐私计算最核心和最关键的就是算法,但每个算法在从设计到实现上经过多个环节,涉及诸多细节。在基础原理上,即使是同一算法从实现原理上也可能有多种不同的实现方案。例如,基于不经意传输和基于同态加密的方案都是从密码学原理出发的,但实现方案却无法兼容。在工程优化上,对于同一密码学协议下的相同算法,不同的设计者也可以选择不同的加速器进行优化,差异依然明显。进一步地,在不同的计算架构设计下,计算方数量也会不同,是否由中间协调方参与、计算方和数据方之间是否独立也会对算法执行产生不同影响。

3.3 不同技术提供者在平台应用管理的设计各不相同

除了核心算法之外,一套完整的隐私计算平台还包含资源授权、任务管理、任务编排、流程调度等相关的控制管理功能,且不同平台整体的系统架构也是结合各自的研发思路和应用侧重来设计实现的,跨平台任务的执行需要适应不同平台的这些设计。因此,基于不同隐私计算平台共同完成同一计算任务,就必须要解决基础功能和算法实现如何在不同平台上兼容和适配的问题。

3.4 技术提供者之间相互适应的驱动力不足

除了技术产品设计本身的复杂性之外,技术提供者们的驱动力不足也会对实现互联互通产生障碍。无论是技术路线的选择、核心算法的设计和基础功能的实现,都是各个隐私计算技术提供者最核心的设计思想和知识产权,实现互联互通的过程中势必会存在一定的相互迁就与妥协,损失产品原有的个性化。现阶段,在隐私计算的应用探索仍在推进,用户增量不断,因此在进入存量竞争之前,跨平台互联互通对于技术厂商而言并非“刚需”。因此,已有的探索实践大多是用户侧推动的。

4 隐私计算跨平台互联互通的实现路径

4.1 隐私计算跨平台互联互通应满足的特性

考虑到现有隐私计算技术产品之间存在较大的差异性和商业驱动力的现状,若要实现不同技术产品间的协同,就不能要求所有产品同质化、统一化,必须尊重各平台本身的设计思路和理念,在保证各隐私计算技术平台的独立性、完整性和安全性的基础上对实现互联互通的最基础环节求同存异。因此,隐私计算跨平台互联互通的实现方案应该满足以下特性。

一是互通性。即不同技术平台间应支持通用、规范的通信接口和互联协议,能够进行跨平台的通信、数据交换、互联操作和状态同步。

二是平台自治性。即各平台均应为自治系统,保留对各自平台设计的独立性和个性化,自主管理平台内部的任务协同与资源配置,在参与跨平台互联互通任务时,无需暴露内部的私有协议、模块设置和架构细节。

三是正确性。即跨平台互联互通完成的隐私计算任务与各平台独立完成的隐私计算任务结果保持一致,或偏差在不影响应用的范围内。这是隐私计算技术产品的最基础的功能要求。

四是安全性。即不同平台间的交互和协同应通过统一的安全通信机制、认证与授权机制、安全模型假设等保障跨平台互联互通的通信安全、应用安全、算法协议安全。这是隐私计算技术产品的最关键的应用要求。

五是易扩展性。即不同平台间的互联互通应支持较为灵活的加入或退出,可以随着技术发展适配更多新的隐私计算功能实现方案,实现有机扩展。这要求互联互通方案能够包容和应对未来技术发展带来的挑战。

4.2 隐私计算跨平台互联互通的实现思路

而具体如何实现互联互通,可以对其他技术或行业应用场景中的互联互通经验进行参考和借鉴。比如互联网数据传输场景中的TCP/IP协议、银联银行卡跨行交易的通用报文协议、国内外物联网的跨平台接入协议等都是通过制定系列标准化的协议,约定不同的设备如何组织和接入同一网络并进行数据交互。其中,互联网通过多层次的协议设计连接多设备、多网络的成功经验可以为通过隐私计算串联起的数据流通网络提供较多参考,隐私计算跨平台的互联互通也可以拆解成底层的通信、逐步上升到传输交互和顶层应用,通过逐层定义共识性的技术标准,最终实现规范流畅的跨平台协作。

以相关经验为参考,隐私计算跨平台互联互通的实现路径可以从“底层通信—中间层交互—顶层应用”的思路出发进行设计。通信层需对平台间选择的通信框架、通信接口、数据格式、传输机制等内容进行规范;交互层可以从节点、资源和算法执行三个维度进一步约定在跨平台交互过程中在发现、认证、申请、授权、连接调用、信息和状态同步等环节的规范流程和要求;而应用层则是在规范通信要求和互联协议栈的基础上定义跨平台隐私计算任务实现过程中的协同管理要求和具体场景的实现流程,既包括对跨平台任务编排、调度、执行、监控和存证等方面的统一规则,也包括不同类型计算任务的实现流程的约定。

5 隐私计算跨平台互联互通的探索进展

自2021年开始,很多隐私计算技术提供者和应用侧都开始推进跨平台互联互通的尝试,提出了不同的思路和方案,也取得了一定的进展。

中国电信翼支付的隐私计算技术团队通过引入中间件和区块链智能合约的方式实现了自研Priv Torrent隐私计算平台和FATE开源框架的对接。基于中间件对交互过程中报文的转换实现异构平台节点识别、算法数据报文重构、任务事件转发和任务状态同步;基于区块链的智能合约实现两个平台间底层通信、交互标准以及报文分类和内容(包括过程数据、任务状态和执行结果)的统一。这个方案提供了一种相对低耦合、易扩展的解决思路,中间件可以灵活部署在任意节点,而区块链可以进一步地支持对任务的审计溯源。但是这一方案也存在局限性,一是平台的原生内核限定在FATE框架,二是需要以隐私计算与区块链的耦合作为前提。

富数科技和微众银行在2021年4月宣布突破了隐私计算跨平台、跨架构的互联互通难题,双方团队按照认证、管控、计算三个主要流程,抽象出节点、数据、算法组件、计算任务、存证、认证六大对象模型,提出了从节点互相发现、资源互相共享到算法组件跨平台迁移部署再到计算任务跨平台执行的三阶段思路。类似于这一思路,洞见科技、锘崴科技和蚂蚁集团共享智能部在2021年8月宣布联合攻关完成了具体互通协议流程的架构设计和落地实现。在第一层次统一了节点发现、业务流程对接、资源信息定义和管理的规则之上,进一步实现了三个平台各自独立设计和开发的算法插件可以直接在另两方的平台上运行,并与其他参与方协同完成计算任务的执行和结果输出。这类方案无需引入中间件或其他系统,可以较大程度地保留各自平台算法功能的独立设计,与本文讨论的实现路径基本一致,但是除了算法功能之外,各个技术提供者对于底层通信框架、上层工程化方案的设计仍有诸多坚持,若要取得大范围的行业共识仍有较大难度。

除了以上实施案例之外,华控清交与星云Clustar、矩阵元、冲量在线等技术厂商也宣布建立战略合作探索隐私计算跨平台互联互通。参考互联网中自治系统、边界网关协议和TCP/IP协议的设计思路,华控清交提出了一种定义跨域数据交换(Inter-Domain Data Exchange,IDDE)协议实现互联互通的思路。将不同的隐私计算平台视为独立的自治系统(AS),并参照TCP、UDP和IP协议向上可满足多类应用、向下可兼容多种底层物理通信机制的思路,来规范IDDE中的核心协议。其中,IDDE协议包含控制面、数据面两部分,控制面对节点、资源的信息和任务调度、存证等内容进行规范;数据执行层则负责规范在各隐私计算平台中执行已编排的计算过程。

6 隐私计算跨平台互联互通的未来推进思路

当前,从标准体系层面对利用隐私计算跨平台互联互通的具体方案进行规范势在必行,包括中国信息通信研究院云计算与大数据研究所牵头的隐私计算联盟、大数据技术标准推进委员会(TC601)、全国信息安全标准化技术委员会(TC260)、京金融科技产业联盟等在内的标准化组织和研究机构都在推进相关技术标准的研讨和编写。

但是,隐私计算的跨平台互联互通不只需要在技术层面进行攻关,更需要在商业层面继续突破。因此,相关标准规范体系不能只停留在标准文稿制定层面,等待由统一的规则指导实施,还必须从实践中汲取经验,推广运营事实标准,由正式标准在原则要求层面对事实标准进行引导,由事实标准从实际业务场景中对正式标准进行细化完善,双管齐下,最终在技术方案选择、跨平台协同和具体应用实施的各个环节给出具有普遍共识的、可落地执行的细节指引。

7 结束语

现阶段,隐私计算技术发展尚未完全成熟,对于如何将复杂的技术原理转化为商业化的产品实现已经是百家争鸣,而对于如何将不同技术方案串联起来协同应用于数据互联互通的实际场景,仍有众多观点在持续探讨。在技术发展过程中,只要行业保持对于各类观点思路的开放包容,并坚持通过广泛交流和探索来挖掘最佳实践,相信隐私计算的跨平台互联互通难题也能尽快得到突破。

关键词: 隐私计算 互联互通 数据流通