首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

租客网发布房源的编号需要填吗?

可以填写,也可以不填写。

2020年06月09日 11:04

租客网:深圳房租为何持续上涨?

租客网:深圳房租为何持续上涨?最近一段时间楼市里最出风头的城市就是深圳了,不管是房价上涨到72668元/平米成为全国第一,还是某单价高达11万元/平米的高端楼盘被购房者在一天之内抢购一空,都吸引着大量的关注。当然按照目前深圳给出的楼市行情来看,后期深圳房价真的有可能继续保持上涨的趋势,这对于购房者来说并不是一个好消息,因为这意味着购房者在深圳买房会变得更难!不过这对于深圳年轻人来说,还不是最坏的消息,因为在房价上涨的背景下,复工之后的深圳房租也出现了上涨,这下子这些在深圳工作的年轻人生活压力会变得更大,深圳年轻人实在是太难了。据网友说,去年深圳还能见到房租在600元左右的单间,但今年开年之后市场上单间的价格基本上已经涨到了750元了,平均上涨150元左右,有网友吐槽再涨下去就租不起房了。虽然这几年大家经常吐槽说房价过高,但其实房租更让年轻人难受,因为房价高的话大家可以不买房选择租房,但如果房租价格过高的话那就真的连住的地方都没有了。实际上这几年房租高已经引起了大家的重视,特别是在像北京上海这样的一线城市房租收入比普遍在50%以上,也就是说年轻人每个月的收入有一半都要拿来交房租,剩下的钱只能勉强维持生活。就拿深圳来说吧,现在深圳单间的房租都涨到750元了,但深圳普通的上班族每个月的工资也就是在四五千元左右,每个月的房租加水电都要花一千多元,再加上日常消费,难怪调查显示现在的年轻人存不到钱了。更重要的是,因为这两个月很多人一直待在家里没有出去上班,只拿到基本工资所以收入变得更少了,在这种情况下却遇上房租上涨,很有可能会被生活压力给压得喘不过气来。年轻人面临着高房租的压力,生活变得越来越艰难,但在房东眼里房租水平还是太低了,如果不涨租连成本都收不回。根据上海易居发布的调查报告显示,2019年四季度国内50城的租金收益率只有2.4%。也就是说在当前租金水平下想要收回房产成本需要42年时间,这样的收益率根本就不是房东们所能接受的范围。所以房东总是想着涨租,这也是为什么今年深圳房租出现上涨的原因。虽然大家都知道租金收益率低并不是房租低的原因,而是因为房价过高造成的,但房东会选择下意识的忽略这一点,所以这样来看后期房租价格还有可能会上涨。房子是用来住的不是用来炒的,但很可惜的是就现在市场上还是有很多人把房子看成赚钱的工具,虽然囤房炒房的人变少了,但想着租房赚钱的人还是一抓一大把。在房价被政策有效限制之后,租房市场吸引了大量资本的注意,如果不能及时有效的遏制这种现象,租房市场很有可能会走房价的老路,到时候年轻人的生活处境只会变得更难。所以现在不仅仅要对房价进行调控,也要出台政策对房租价格进行管理,至少要确保房租价格不会大幅度上涨,这样才能让年轻人住得安心。(文章摘自网络,侵删)

2020年04月01日 13:55

百度收录的相关问题及解决方案

百度收录永远是SEOer着讨论的关键话题,在网站优化战争中,稳定的收录直接影响了网站的流量、收入。为何网站首页快照更新很快,可是不收录内页?相信许多朋友与我样在寻找问题的答案。本文跟小贱探讨下网站内页百度不收录的原因分析与对策。  原因1:百度已经索引了但还未放出来排名。  百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站为常见的现象。  对策:我们要做的是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,静心等待着,会有惊喜的。  原因2:robots设置问题导致内页不受引擎蜘蛛爬行索引  对策:检查是否语法错误屏蔽了蜘蛛爬行,其中包括metarobots与nofollow等标签的的设置。  原因3:文章原创度问题.  头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。  对策:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,好是能每天定时更新让百度对你网站抓取也有守时的好习惯。  原因4:网站内部链接存在问题.  比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。  对策:针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。  原因5:网站使用了黑帽手段,百度识别了欺骗手段整站降权。  对策:远离关键词堆积、群发,黑链等黑帽行为,网站的长期稳定少懂歪脑筋,百度有动作没很难挽回了!  原因6:服务器无法访问,速度缓慢、被挂马等情况。  百度蜘蛛索引内容时,多次识别网站有着大量错乱代码或者遇到服务器无法访问,网站被列入观察名单。  对策:做好网站代码优化提高页面读取速度,选择负责任的安全空间服务商,成熟的网站程序并定期更新补丁,定期对修改文件痕迹做好跟踪。

2020年04月04日 03:55