点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
2022年初,国务院办公厅在《要素市场化配置综合改革试点总体方案》指出,要探索“原始数据不出域、数据可用不可见”的交易范式。隐私计算作为能够实现该范式的重要技术手段之一,得到了行业的重视。为适应隐私计算技术快速发展的需求,中国信息通信研究院安全研究所联合业界20余家企业牵头研制了行业标准《电信网和互联网联邦学习技术要求与测试方法》(以下简称“联邦学习标准”)、《电信网和互联网多方安全计算技术要求与测试方法》(以下简称“MPC标准”),目前联邦学习标准已进入送审阶段,MPC标准已经报批。
一、标准内容
从总体框架角度来看,联邦学习和MPC标准均以软件、平台、系统等技术载体作为约束对象,提出了功能性、安全性、性能三大方面的技术要求,并给出了相应的测试方法。为适配现阶段隐私计算的技术水平以及实际应用需求,系列标准突出了以下几个特点。
1.以toB形式的隐私计算技术应用场景作为要求重点
当下,隐私计算需求主要源于组织机构之间,其特点在参与方数量少,多数情况下参与方数目为两方。这种情况下,各参与方所能提供的数据质量往往能够得到保障,且各方往往处于互相信任的状态。为适应隐私计算的应用现状,系列标准以toB形式的隐私计算技术应用场景为重点,提出要求。
在联邦学习标准中,标准从任务发起、数据输入、算法输入、任务执行、结果输出、模型管理几个大的功能方面来进行全面要求,以确保一个企业级联邦学习应用的基本功能的可用性。例如,在算法输入方面,标准要求联邦学习应用应支持所列的基本算法,以此保障联邦学习应用能够实现最基础的功能且具备一定的通用性。
同时,联邦学习标准规定了一个实体可承担一个或多个角色方,这意味着在一个仅有两方参与的联邦学习任务中,两方可以约定各自担任多个角色,这也是toB形式隐私计算的特点。
MPC标准在相关的要求上,与联邦学习标准类似,不再赘述。
2.安全性要求贯穿全部流程
安全性是数据流通过程中重点关注的内容,安全性上的欠缺可能会引发严重的数据安全事故。因此,系列标准提出了两类安全要求,一是通用安全要求,二是应用流程算法安全要求。通用安全要求与各应用流程场景的算法安全要求一起,构成了完整的安全性要求。
(1)通用安全要求
通用安全要求是针对系统或平台的应用层面提出的基础安全要求,包括了认证授权、健壮性、通信安全、存储安全、展示安全、存证日志、密码安全。这些要求主要针对系统的应用层面,例如,在认证授权要求方面,这里指的是系统操作人员(用户)的身份验证和授权机制,是基于应用层面的,而非算法中的参与方实体的认证授权。
(2)应用流程算法安全要求
在联邦学习标准中,标准将联邦学习流程划分成了6大场景,分别是:数据管理、联邦对齐、特征处理、模型训练、模型评估、模型预测。针对这六个场景的特点,分别提出了安全性要求。这些要求主要从数据授权、中间参数传递、敏感数据归属、结果分配等几个方面进行了约束。
而在MPC标准中,多方安全计算被划分成了基本运算、隐匿查询、隐私求交三大场景,要求的约束思路与联邦学习安全标准相同。这些场景要求能够使约束对象在算法层面上满足安全性需求。
3.以无主动攻击导致的数据泄露作为安全性要求的尺度
在目前实际的隐私计算应用中,由于数据流通的双方(或多方)通常是互相信任的企业或机构实体,成功完成数据流通任务是各方的一致目标,因此在实际应用中,各方在绝大多数情况下不会对其他参与方发起投毒攻击、梯度攻击、合谋攻击等主动攻击行为。然而,却不能排除存在各方内部操作人员通过己方在计算过程中所获得的信息直接或间接获取对方原始数据、敏感数据的行为。因此,为适配实际应用,避免拔高实际要求,系列标准均未对参与方的主动攻击提出防御要求,但对参与方的被动安全性提出了严格的要求,即将无主动攻击导致的数据泄露作为安全性要求的标准尺度。
例如,在联邦学习标准对模型训练场景的要求方面。首先各方之间要互相获得授权。而后在训练过程中各方所能够接触到的数据,应以不能直接获取或间接推导出对方的原始数据或敏感数据为标准,这就要求多方算法在设计过程中要考虑每一步传输的数据,避免传输可推导、可利用的中间参数。最后,模型训练结束时,训练结果作为敏感数据,被要求仅结果使用方能够获取。
4.性能要求依实际应用场景而定
在性能要求方面,系列标准提出了两个指标:准确率指标和效率指标。系列标准针对的是互联网和电信网环境,该环境所涵盖的业务场景十分广泛,准确率和效率指标在不同业务场景下的要求各不相同,因此标准未给出统一的性能参数,而是将性能参数与业务场景强绑定,要求系统性能满足系统所在的业务场景需求。
二、标准应用实践
中国信通院安全研究所大数据应用与安全创新实验室依据隐私计算系列标准开展了联邦学习、多方安全计算的检验业务,其中联邦学习安全性检验已联合泰尔实验室、中互金认证获得了国家认监委认可。截至2022年12月,已有30余款联邦学习/多方安全计算产品通过了实验室检验,发挥“以测促供,以评促用”的作用,推动隐私计算产品供给侧质量、数量的 “双量”提升,同时为需求侧企业数据安全技术能力提升提供参考。
与此同时,中国信通院安全研究所将联合多方力量,持续推动标准实践应用,聚焦行业热点,构建交流平台,满足隐私计算厂商、最终用户的多方需求,助力隐私计算技术与应用的健康发展。
附:
1.《电信网和互联网联邦学习技术要求与测试方法》(送审稿)行业标准参编单位(排名不分先后):
中国信通院、中国电信、中国移动、富数、微众银行、洞见、同盾、华控清交、数牍科技、金智塔、字节跳动、百度、蚂蚁、美团、京东、腾讯、快手、oppo、奇安信、安恒、安华金和、绿盟、天融信、恒安嘉新、信大捷安。
2.《电信网和互联网多方安全计算技术要求与测试方法》(报批稿)行业标准参编单位(排名不分先后):
中国信通院、中国电信、中国移动、富数、洞见、同盾、华控清交、数牍科技、金智塔、百度、蚂蚁、美团、京东、腾讯、快手、奇安信、安恒、安华金和、绿盟、观安、天融信、恒安嘉新、信大捷安。
供稿 | 中国信息通信研究院安全研究所