随着数据安全法、个人信息保护法的落地,数据安全受到了越来越多的关注。而如何保护数据安全也成为了企业责任与义务。其中,数据脱敏就是保护数据安全的方式之一。


【资料图】

那么,什么是数据脱敏呢?

数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

查阅相关报道了解到,常见的数据脱敏方法,集中在泛化、抑制、扰乱和有损四方面:

泛化和抑制都是通过对数据实施取整、归类、截断、掩码屏蔽等方式降低数据的精度实现的脱敏,脱敏后数据在一定程度上保留了原始数据所携带的非敏感信息;

扰乱是指通过对数据中的敏感信息使用重排、加密、散列等方式,破坏其结构,脱敏后数据的敏感信息被完全隐藏,因此极难推断出原始数据所携带的敏感信息;

有损是指限制对数据集的敏感行数和列数向目标环境的交换来保护敏感数据不外泄。

通常,良好的数据脱敏实施,需要遵循如下两个原则,第一,尽可能地为脱敏后的应用,保留脱敏前的有意义信息;第二,最大程度地防止黑客进行破解。

此外,数据脱敏还可分为静态数据脱敏和动态数据脱敏:

静态数据脱敏:是数据的“搬移并仿真替换”,是将数据抽取进行脱敏处理后,下发给下游环节,随意取用和读写的,脱敏后数据与生产环境相隔离,满足业务需求的同时保障生产数据库的安全。

动态数据脱敏:在访问敏感数据的同时实时进行脱敏处理,可以为不同角色、不同权限、不同数据类型执行不同的脱敏方案,从而确保返回的数据可用而安全。

据了解,企业内部常见的数据脱敏场景主要包括数据报告脱敏、应用系统脱敏、数据库脱敏等。

静态(数据文件)脱敏:适用于批量进行脱敏数据。比如用于模型训练的测试数据;数据的导出用于离线数据分析等。

动态(数据库)脱敏:动态数据脱敏主要指的是数据库脱敏。具体而言,指的是比如研发人员的开发调试、DBA(数据库管理员)日常数据管理、运维人员基础运维等。

应用系统脱敏:应用系统脱敏主要指的是前端页面的敏感数据脱敏,以及数据类型接口API的透出数据脱敏。

数据报告及数据产品脱敏:这类场景主要包括内部的数据监控类产品或者看板、对外服务的数据类产品、基于数据分析的报告,比如业务汇报、项目复盘等。

最后,值得一提的是,数据脱敏要确保脱敏过程的代价可控,在合规的前提下,得到满足业务需要的数据结果。在实施数据脱敏时,往往需要平衡脱敏后数据或数据集的安全性和可用性。

责任编辑:

推荐内容