一种关系型实时数据发布的隐私保护方法与流程
数据隐私保护法:了解相关法规,保护自己在大数据时代的权益。 #生活知识# #生活理念# #数字素养理念#
1.本发明涉及隐私保护领域,具体是一种关系型实时数据发布的隐私保护方法。
背景技术:
2.随着物联网的兴起,各种智能设备与系统在现实生活中随处可见,促使数据呈爆炸式的增长。从智能设备收集的实时数据可用于智能化建设,如智能医疗、智能交通系统、智能电网系统等。然而,这些收集的数据中通常包含大量的个人敏感信息,例如薪资、疾病记录以及位置信息等。如果这些数据未经处理就进行发布或使用,将造成严重的隐私泄露问题,进而导致用户个人财产、人身安全等受到威胁。
3.为了保护实时数据发布中的个人隐私,目前的方法是在针对实时数据发布时加入隐私保护模型为数据的隐私安全提供技术保障。但现有的隐私保护方法仍存在着诸多问题,在数据实用价值、数据效用和隐私安全等方面均存在一定的局限性。例如,将p-sum和ε-差分隐私结合的隐私保护方法,可用于连续发布统计数据,但该方法只满足了事件级的隐私保护;基于距离进行采样而提出的dsft和dsat隐私保护方法能够减少动态更新数据集时重复噪声导致的高积累误差以提高数据效用性,但未考虑隐私预算分配的优化问题;基于差分隐私的模型在实时数据发布中,该模型只考虑流数据本身的隐私而忽略了身份和属性之间的联系,且该方法只局限于原始数据挖掘任务上的隐私安全,因此具有一定局限性。
4.因此,如何设计一种方案,能够保护实时数据发布中的隐私安全并提高发布数据的实用性是当前亟需解决的难题。
技术实现要素:
5.本发明的目的是为了解决现有的实时数据进行隐私保护时工作量大、信息损失大,存在伪造元组以及噪声对发布数据的实际价值会产生影响等弊端。
6.本发明的创新之处在于:所引入的m-签名可保证攻击者推断出用户身份与隐私信息正确关联的概率小于且候选列表中的元组可以在模糊技术处理后直接发布,不存在延时发布情况,同时该方法能够完全有效抵御m-差异攻击。
7.为了达到上述目的,本发明采取如下技术方案。
8.首先对本发明涉及的概念内容进行说明。
9.1.m-签名。如果每个桶至少包含m个元组和最多2m-1个元组,并且每个桶中所有元组都有不同的敏感属性值,该桶满足m-签名。
10.2.基于统计的模糊处理技术。敏感属性值通过成员函数归入不同的模糊集fuzzy sets(fs),使用其模糊集的值代替敏感属性值的操作定义为模糊处理。模糊统计可用来构建成员函数。假设集合fs包括所有记录,那么fs={fs1,fs2,...,fsn},其中,fsi是第i个模糊集合。令s为fs的敏感属性值,则s在fs中的成员频率可表示为p(s)=|s∈fsi|/m(i=1,2,
…
,n),其中m为所有记录的数量,|s∈f si|为fsi中s的数量。具体来说,当fsi中的p(s)大
于其他模糊集时,敏感属性值s属于模糊集fsi。此外,本章中每个模糊集至少应包含m个不同的敏感属性值。当特定的敏感属性值由模糊集的值所替代时,敏感属性值泄露的概率最多为模糊处理不仅概化了敏感属性,而且可以保证敏感属性值的泄露概率小于由于隐私保护的核心思想是属性值概化处理,类似于匿名处理,故模糊处理应用于隐私保护是合理的。
11.3.信息损失。准标识符上的信息损失(qi):假设一个等价类为ec={t1,t2,
…
,tn},其准标识符表示为qi={q1,q2,
…
,qm}。此外,令|ec|表示等价类ec的大小,则概化后ec的信息损失定义为:其中,|dmj|为属性qj的域的大小,|gj|为属性qi上概化区间的大小。
12.敏感属性(s)上的信息损失:假设fsi(t)={t1,t2,
…
,tn},其中,ti是属于模糊集fsi的元组。fsi[t]表示元组t的模糊程度,则fsi和fs的信息损失定义为:和fs的信息损失定义为:其中,fsi[t]的值等于1/|fsi|,|fsi|是fsi中敏感属性值的数量。
[0013]
一种关系型实时数据发布的隐私保护方法,具体包括以下步骤:s1、m-签名与候选列表生成;s2、模糊处理方案;s3、模型构建。
[0014]
优选地,m-签名与候选列表生成的具体流程为:首先,让模型满足(k,m)匿名性以保证每个发布的表具有高安全性,进而使敏感属性值的泄露概率小于其次,为减少信息损失,在实现(k,m)匿名化的过程中采用自上而下的局部编码方法。然后,定义m-签名以抵御m-差异攻击,每个qi组(等价类)都需要满足m-签名;同时将这些带标签的等价类(表示为桶)保存在bucket中。若一个元组不再bucket中,它将保存在相应的候选列表candidate中。
[0015]
优选地,模糊处理方案的具体流程为:为候选列表中元组的敏感属性设置不同的模糊集,而这些模糊集需满足以下的隐私保护条件:(1)敏感属性值模糊化后,发布的数据可以达到预期的安全期望值(即,隐私泄露的概率不大于(2)整个模糊集可以覆盖所有敏感属性值;(3)设置的模糊集不仅能保留数据的实用性,且不会泄露个人隐私信息。
[0016]
优选地,模型构建的具体流程为:为了抵抗链接攻击,在模型中每个子表首先需要满足(k,m)-匿名。即假设t1是原始子表,那么t1的每个等价类ec都是熵m-多样性。之后,当m≤l时,ec的元组可以生成m-签名。对t进行更新操作后的可发布的子表,它可以抵御m-差异攻击。
[0017]
在构建算法中,包括两部分:bucket和candidate。δeci是等价类eci在时间戳i和时间戳i+1上的更新信息,其中,包括更新的数据和更新类型(即插入、删除和修改)。
[0018]
综上所述,本发明提供了一种关系型实时数据发布的隐私保护方法,该方法是基于m-签名和模糊处理的新型匿名模型,适用于实时数据发布,可以高效处理插入、删除和修改等数据动态更新操作,同时所有的数据都能实时发布且不产生任何伪造的元组和噪声,保证了发布数据的真实性。
附图说明
[0019]
图1为本发明实施例中满足3-签名组的信息图。
[0020]
图2为本发明实施例中δeci的信息图。
[0021]
图3为本发明实施例中update(bucket,candidate,δti)的计算结果图。
[0022]
图4为本发明方法的流程示意图。
具体实施方式
[0023]
下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均属于本发明保护的范围。
[0024]
一种关系型实时数据发布的隐私保护方法,包括如下过程:s1、m-签名与候选列表生成;s2、模糊处理方案;s3、模型构建。
[0025]
在本实施例中,s1中,m-签名与候选列表生成的具体流程为:如图1所示,有11个元组的qi组,元组的敏感属性值为:{s1,s1,s1,s2,s2,s3,s4,s5,s6},该qi组经过3-签名处理后端结果划分为一个候选列表和三个桶。然后对其进行m-签名的生成。ec是一个qi组,满足m-签名的桶保存在bucket中,bucket是桶的集合,其他元组保存在candidate中。在模型中,qi组是由bucket和candidate组成的。
[0026]
m-签名的生成算法如下:
[0027]
在本实施例中,s2中,模糊处理方案的具体流程为:以患者住院数据为例,在通常情况下,敏感属性“患病”在模糊处理中可划分为a={轻度疾病},b={中毒疾病},c={严重疾病}。如果在集合a、b和c中至少有m种疾病,则集合a、b、c是模糊集合。具体来说,攻击者猜测到的隐私泄露的概率最多为
[0028]
故上述模糊集的分类条件需满足:(1)所有疾病都可以归入模糊集a、b和c(2)模糊集a、b和c中的数据仍保留有实用价值的信息,同时模糊集中的新型可以在外部环境和信息所观察到,且不涉及太多的个人敏感信息。
[0029]
(3)模糊集的分类能够满足隐私保护的要求。
[0030]
根据模糊集将主表可划分为不同的子表,每个子表可进行独立处理和发布。每个子表的候选列表根据对应的模糊集执行模糊处理和发布。如图1所示,该组中的模糊集为“轻度疾病”,则candidate中的“s1”在发布版本中替换为“轻度疾病”。
[0031]
在本实施例中,s3中,模型构建的具体流程为:update(bucket,candidate,δti):根据δti的元组,对bucket和candidate执行更新操作。其中,更新规则是:(1)candidate的更新优先级高于bucket;(2)签名短的优先级高于签名长的;(3)现在参与过更新的签名优于未被更新的签名。
[0032]
模型的更新过程的具体算法如下:
[0033]
按照以上算法,h为图2中的前两个元组。在update(bucket,h)处理之后,剩余元组和新生成的元组保存在candidate中,而“*”用来索引candidate中没有标签的新元组。最后,update(bucket,h)的结果如图3所示。
[0034]
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都应落入本发明保护的范围。
网址:一种关系型实时数据发布的隐私保护方法与流程 https://www.yuejiaxmz.com/news/view/733429
相关内容
一种基于联邦学习的电表用电数据的隐私保护方法与流程【数据应用案例】关系数据的隐私保护
大数据时代的隐私保护
数据隐私保护
数据安全与隐私保护:大数据时代的挑战与机遇
一种工业互联网数据隐私保护方法和系统技术方案
大数据安全与隐私保护:实践指南
数据隐私保护:维护个人隐私权和数据安全的方法.pdf
数据隐私保护:保护用户隐私的最佳实践
数据隐私与安全保护指南.pptx