2020-12-17 23:16:1814236人阅读
伴随中国经济进入转型升级新周期,人工智能等新技术的融合应用正在成为提升竞争力的关键。在这之中,数据的流动和聚合所引发的安全议题也成为各界持续关注的焦点。(文末可查看下载白皮书)
12月17日,在北京举行的2020百度云智峰会ABC SUMMIT上,百度与英特尔联合发布了《机密计算助力深度学习,安全及能力兼得》白皮书。首次详细解读了基于英特尔SGX软件防护扩展技术,MesaTEE安全计算平台与百度飞桨开源深度学习平台的联动赋能,展现了为深度学习定制的机密计算能力所带来巨大前景和可能。
英特尔产品规划总监李志强在会上分享了关于机密计算的相关研究进展
百度资深工程师陈治宇展示了MeasTEE与飞桨的结合
作为飞桨在自身生态系统内实现机密计算的硬件解决方案核心服务框架,MesaTEE于2018年9月由百度安全联手英特尔正式对外发布。其基于英特尔SGX技术,使用内存安全的Rust语言开发,旨在构建内存安全的可信计算平台。在隐私保护的前提下,打破产业链上下游既有的数据壁垒,有效解决数据流通与协作过程中的合法合规、数据安全问题,充分激发数据要素价值,实现数据“价值”与“知识”开放与共享,真正做到“数据可用不可见”。
不论是对于飞桨而言还是开发者来说,利用MesaTEE来实现硬件级的机密深度学习能力都有着巨大的优势:
首先,在SGX技术的支持下,飞桨得以在TEE环境中的运行。当搭载即将推出的全新的第三代英特尔至强可扩展处理器时,其有效的隔离内存容量可以极大的提高;而硬件级解决方案也排除了网络限制,避免了网络故障导致大型训练任务中断的风险。
其次,飞桨与TEE环境的结合使得前者自然成为了一个巨大的分布式可信机密计算环境,这让使用兼容英特尔处理器的用户在使用时无需付出额外成本,减少了对于购置专用加密设备的投入。
第三,MesaTEE也提供了更为便捷的接入流程。开发者最快仅需3步、在3分钟内即可完成系统的安装和运行。而良好的兼容性,也使其能够支持包括SCONE、Occlum和Graphene在内的大多数SGX TEE容器。
百度MesaTEE整体架构
更具创新性的意义还在于,MesaTEE也是一个多方任务协作平台,可通过任务方式管理合作流程,确保执行流程不受外界干扰。在确保信息安全的前提下,使各个参与方公平地完成任务协作,达成共识后获取各自所需的计算结果或模型。目前,在TEE环境中运行的飞桨深度学习平台已为多个领域提供了机密计算的典型示例,打破了数据提供方、建模方与使用方之间彼此割裂的隔阂障碍。
百度飞桨深度学习平台与MesaTEE的联动
例如在医疗影像筛查方面,其便可在充分保护病患隐私的同时,快速实现从特征提取到整体图像识别的完整一体化识别任务。大幅提升医疗影像识别的效率和精准度,加快患者诊疗速度,缓解临床医生工作压力,并为医疗机构、尤其是医疗资源受限和医疗水平偏低的基层医院提供有效的数据支撑和辅助诊断工具。而在金融风险控制方面,其则有助于帮助金融机构安全地与众多数据源合作,获取更多维的用户画像数据,打造更健壮的信贷风险评估模式。
面对已然到来的智能经济时代,数据已经成为企业的核心资产,个人信息保护问题也正为更多人所关注。基于英特尔SGX技术开发的MesaTEE安全计算平台与飞桨深度学习平台的联动,不仅将更好地实现性能与安全的统一,也将大大延展互联网信任的技术边界,孵化和构建更安全的AI生态。
目前,MesaTEE的社区版已正式成为Apache基金会的孵化器项目(Apache Teaclave),其将有助于汇集更多力量进一步丰富内存安全的SGX技术生态。而随着飞桨深度学习平台即将进入2.0时代,其也将在TEE环境中完整实现其已有的相关功能,并提供musl的预编译版本。
未来,百度也将与英特尔持续加强合作,不断推动机密计算能力与安全计算平台的应用落地,为“新基建”格局下的产业发展贡献力量。
项目地址:
https://github.com/PaddlePaddle/Paddle/tree/develop/paddle/scripts/musl_build
使用说明:
https://github.com/PaddlePaddle/Paddle/blob/develop/paddle/scripts/musl_build/README.md
点击查看下载白皮书:
中文版:Intel PRC - SGX PaddlePaddle Case Study-CN-final 20201216.pdf
英文版:Intel PRC - SGX PaddlePaddle Case Study-EN-final 20201216.pdf