
前言
近年来,各国政府密集发布数据安全相关的战略政策、法律法规和标准规范,推动了数据安全产业的快速发展。首先,自2018年欧盟GDPR(General Data Protection Regulation,通用数据保护条例)颁布之后,全球大部分地区陆续出台了针对个人隐私保护的法律法规,隐私合规要求日益严格,直接推动了面向个人信息保护的相关产业发展;其次,网络安全攻击和企业敏感数据泄露事件频现,面向安全攻防的数据安全治理与防护也成为企业CISO(首席信息安全官)的重要工作;最后,数据和智能驱动的新质生产力加速了各行业的转型升级,挖掘数据要素的内在价值,建立多方信任以推动数据流通,将会是数据要素安全的核心目标和价值。以上三个因素共同推动数据安全产业发展与升级,在不久的将来,我们将看到以数据要素为核心的数据要素安全产业体量会快速增长。
与此同时,学术界的数据要素安全前沿研究和产业界的创新技术应用也高度融合统一,如联邦学习、可信执行环境和同态加密等技术,每一个新的研究成果都带来了一轮新的技术应用,或提升了现有效率,或增强了安全能力。
我们观察到有学术专家直接投身于数据要素安全产业并成立创业公司,如法兰西科学院院士、知名密码学专家Pascal Paillier担任了Zama公司的CTO(首席技术官),为大语言模型(后文简称大模型)提供全同态加密方案的支持。正是各类新领域、新需求的融合和碰撞,造就了数据要素安全产业的大量创业公司,也催生了大量创新技术。
在这一轮技术革命中,国内技术界也扮演了重要的角色。例如,国内主导的知名隐私计算项目FATE、隐语等,引导了国内联邦学习、安全多方计算和机密计算领域的开源生态系统发展。这充分展示了国内在数据要素安全方面的巨大需求和技术储备,我们完全有能力构建领先、创新、自主的数据要素安全技术栈。事实上,数年来,绿盟科技创新研究院在FATE社区持续投入,让隐私计算更好用、更安全,也因此获得了诸多荣誉与认可。
学术成果和创新技术的高度融合和快速涌现,在其他安全细分领域并不常见,这恰恰反映了数据要素安全领域的迫切需求和极高的技术要求,促使该领域近年来出现了大量创新技术。因此,笔者认为有必要对该产业及技术发展进行系统性的梳理和总结,以便读者更好地理解数据要素安全的整体趋势。
本书分为三篇。在体系篇,第1章阐述了数据要素安全产业的发展历程,第2章则分析了全球数据安全的立法、标准和监管现状,这些是产业和技术发展的驱动力。
基于数据安全标准和主流研究成果,第3章介绍了当前数据要素相关的安全架构。其中,数据流通的生命周期、数据安全治理体系等概念已获得业界的广泛认可;而数据确权等议题则涉及立法、财会和信息技术等多个领域,仍在持续研究中,尚未达成共识。
技术洞察篇介绍了数据要素安全相关的主流技术,由于这些技术种类繁多,笔者根据其适用场景,将它们划分为“数据安全自用”“数据可信确权”“数据可控流通”“协同安全计算”四大类,并分别在第4~7章对它们进行详细阐述。近年来兴起的大模型或者更广义的人工智能,对数据安全提出了新的要求,也给数据安全带来了新的解决方案,因而我们在第8章特别讨论了大模型与数据安全的关系。
需要注意的是,每种创新技术都有其独特优势和局限性,不存在一种技术能够适用于所有客户和所有场景。因而我们在讨论特定技术时,需要了解其出现的背景、优劣势,以及它能给客户带来的价值。本书在技术洞察篇详细介绍了数据要素安全相关技术的原理和特点,并在实践案例篇展示了这些技术在实际应用中的效用与价值。
为了方便读者更好地理解这些技术,我们在介绍技术原理后,如有开源工具,也会提供使用这些开源工具的指导。不过,开源社区非常活跃,各类技术日新月异,所以当你阅读本书时,可能会发现具体的软件版本、命令参数已发生改变,但技术应用的思路是恒久不变的。当然,如果在阅读和实践中遇到了问题,欢迎通过电子邮件联系笔者团队(liuwenmao.thaa@vip.163.com)。
最后,书中难免存在疏漏,敬请读者批评指正。
刘文懋
2024年10月
北京