专利示意图
一、技术领域
兴趣点推荐领域
二、专利介绍
1.专利信息
专利类型:发明
专利权人:清华大学深圳国际研究生院
申请号:202310010482.8
发明人:张凯、王超群、董宇涵
2.专利说明书摘要
本发明公开了一种用户兴趣点推荐方法,包括如下步骤:将隐私数据与真实标签输入到教师模型进行训练;教师模型训练结束后,将公开数据输入到教师模型,教师模型输出软标签;将公开数据输入到学生模型,并将软标签输入到学生模型进行训练;学生模型训练结束后,运用学生模型向用户推荐兴趣点。能够实现充分利用教师-学生蒸馏框架中教师模型知识被学生模型吸收的特性,学生模型在不直接使用教师模型训练数据(隐私数据)的情况下完成训练,实现了学生模型和隐私数据的隔离,可以有效应对深度学习模型的反向推演攻击;即使有被攻击的风险,也不会造成隐私数据的泄露,从而实现了对用户隐私数据的保护。
3.创新点
(1)本发明涉及POPI预测领域,针对POI预测模型遭到攻击可能造成大规模用户隐私数据泄露的情况,提出一种在隐私保护条件下基于知识蒸馏的POI预测方法;
(2)该方法基于教师-学生蒸馏框架,通过充分利用教师模型知识被学生模型吸收的特性,能够在不暴露原始用户隐私训练数据的情况下进行线上POI预测;
(3)本方法实现了隐私保护条件下,在保持性能的同时压缩模型,提高计算效率,减少运算成本。
4.痛点问题
(1)线上运行的POI预测模型一旦遭到攻击,用于训练的大规模用户隐私数据会通过反向推演等方式被泄露,不仅对个人用户造成严重影响,也会对企业造成重大的经济和信誉损失,甚至影响社会稳定;
(2)线上运行的POI预测模型参数多体量大,推理时间长,运算成本高,计算效率有较大的提升空间。
5.技术优势
(1)现有技术的训练数据仍然采用原始的用户隐私数据,一旦密钥泄露,特征和数据很快被解密,造成大规模的数据泄露,安全性较低。而本技术中的学生模型不采用用户隐私数据进行训练,因此攻击者无法通过任何攻击方式复原用户隐私数据;
(2)现有技术模型参数规模较大,而本技术用于线上推理的学生模型参数量小,计算效率大大提升,推理时间短,运算成本低。
三、产业化信息
1.应用场景
(1)本地生活类互联网产品可以利用该技术,在隐私保护的条件下给用户推荐下一个可能感兴趣的餐厅或景点,丰富用户选择,完成用户与商家的匹配;
(2)地图类互联网产品可以利用该技术,在隐私保护的条件下给用户推荐用户可能想到达的地点,节约用户选择地点时间;
(3)交通管理部门可以利用该技术,在隐私保护的条件下预测人流量大的地点以及人流变化,提前做好措施防止交通拥堵。
2.商业价值
此项技术拥有巨大的商业前景和社会价值,对于互联网行业有以下市场价值:
(1)提升用户与商家之间的匹配程度,丰富用户选择的同时大幅提升商家收入;
(2)提升运算效率的同时大幅减少计算成本,降低互联网公司机器与人力运维成本;
(3)隐私保护技术避免了数据泄露及可能造成的用户财产与公司信誉损失。
3.发展规划
该技术未来在基于位置的预测与推荐领域都有广泛的应用,包括本地生活类互联网产品。地图类互联网产品和交通部门的管理等,实现隐私保护条件下的POI预测,大大提升用户隐私数据的安全性,同时降低运算成本,提升计算效率。
4.合作方式
面议
注:所有成果未经授权,请勿转载
联系方式:ttc@sz.tsinghua.edu.cn