九江市知识产权信息公共服务平台

当前位置 :  首页 > 一种基于排序分类的个性化推荐中的隐私保护方法

一种基于排序分类的个性化推荐中的隐私保护方法

时间:2024-04-24 来源:国家知识产权局专利检索与分析系统

公开(公告): CN111259260B

标题: 一种基于排序分类的个性化推荐中的隐私保护方法

法律状态/事件: 授权

当前申请(专利权): 九江学院

应用领域分类: 其他数据库聚类/分类|特殊数据处理应用

申请日: 2020-03-30

公开(公告): 2023-06-02

摘要: 一种基于排序分类的个性化推荐中的隐私保护方法,该方法提出的ESPRC框架的核心是处理用户数据在提交给第三方推荐服务之前,让用户的隐私得到保障的情况下,可以享受来自第三方服务的高质量推荐;用户数据的混淆处理首先对用户数据进行排序再分类,得到高敏类数据和低敏类数据;再对用户的高敏类数据进行数据保序混淆;最后对用户的低敏类数据进行数据噪声混淆。既保护了用户数据效用又保障了用户隐私安全。

第一权利要求: 1.一种基于排序分类的个性化推荐中的隐私保护方法,其特征在于,该方法包括以下步骤:

a、用户数据建模:在形式上,用U表示用户集,I表示用户项目集即单个用户数据的数量,用D表示所有的用户数据,用Y表示所有的用户隐私数据;则用户u的数据集合表示为Du,大小为|I|Yu表示用户u的一种隐私数据,每个用户具有相同的数据量;在用户数据集合里可以展现这个用户对一些活动项目的喜爱程度,用du表示用户u的某个数据;用户订阅第三方推荐服务时,服务提供者将立即访问用户的数据集Du,首先将用户数据按它的喜好程度进行排序,从高到低,分两类,一类是用户喜爱程度相对高的称为高敏类,另外一类是用户喜爱程度相对较低的称为低敏类;

b、对用户高敏类数据进行数据保序混淆,具体步骤如下:

1)首先对隐私泄露进行度量;混淆数据学习的主要思想是将用户高敏类数据混淆成另一个用户的高敏类数据,数据相似,但是隐私泄露减少了,并且还能用于第三方推荐服务;需要处理的用户数据为高敏类可以表示为混淆后的用户数据表示为该用户的隐私数据为Yu;在确定的用户隐私数据Yu的情况下,用户信息即为分别通过观察用户数据与用户混淆数据获取的信息量的差值ΔC,可用来表示用户隐私泄露量MI;信息量的大小可用信息论方法中的熵来表示,互信息与熵之间密不可分;则从用户数据中获取的信息量可以表示为如公式(1)所示;

则表示用户数据中某个数据出现的概率;如需求得互信息的值,则还需要计算条件熵,与之间的条件熵如公式(2)所示;

与分别表示数据和数据的联合概率和条件概率;最终互信息的计算如公式(3)所示;

2)然后在隐私泄露较小的情况下同时保证个性化推荐的数据效用,就需要限定数据失真范围T即排序损失程度;使用肯德尔相关系数Tau,用逆序对数量来量化两个排序列表的不一致程度;用户原始数据和用户混淆数据取第i个数据分别用和表示;如果有且或者且时,则认为与是一对顺序一致的元素对,则其数量可表示为E,其中I表示用户项目集即单个用户数据的数量;如果有且或者且则认为与是一对顺序不一致的元素对,则其数量可表示为F;具体的肯德尔相关系数计算如公式(4)、公式(5)、公式(6)、公式(7)所示;

其中,表示为中数据的总个数,tutv分别表示和中数据的总个数,重复数据视为一个数据;cjdj分别表示和中第j个数据的个数,重复数据视为一个数据;S则为和之间两两数据配对的总对数,因为和的数据总数是一致的,所以S可以用的数据总个数来进行计算;A表示为中重复数据进行两两数据配对的总对数;B表示为中重复数据进行两两数据配对的总对数;

3)最后获取最优的用户混淆数据,在上述测量用户隐私泄露量与计算肯德尔相关系数的基础上,进行条件约束来获取最优用户混淆数据即将另一用户的高敏类数据赋予当前需要混淆数据的用户;在此过程中,依据用户的不同隐私数据,进行某一类隐私数据的保护;

数据失真约束;为了减少隐私泄露,我们将用户数据Du混淆化;但又需要让混淆后的用户数据Dv还可以继续用于个性化推荐;所以在用户数据混淆的过程中,不仅需要对用户隐私泄露进行度量,还需要制定数据失真约束T,保证用户数据的效用;则数据失真约束模型可用公式表示;

dc(DuDv)DuDv之间距离的度量,T则限制了数据失真范围;保障混淆数据的实用性;在给定的数据失真范围T下,最小化信息量差值ΔC来获得最优的混淆数据;

c、对用户低敏类数据进行数据噪声混淆:采用差分隐私的思想;直接给用户数据加入噪声,该噪声的产生满足差分隐私不等式;噪声产生的机制是拉普拉斯;该机制依据不同的随机变量α值,使用不同的服从参数为μ和的Laplace逆累积分布函数,计算得出噪声值noise;直接在用户原有的数据上加上噪声值,保护用户隐私;在此机制基础上令其参数μ等于0,形成新的Laplace逆累积分布函数,公式如(8)所示:

IPC分类号: G06F16/9535 | G06F16/906