文章目录
前景
数据越多,训练出的模型效果就越好
你有数据,我有数据,那么让大家的数据都集中在一起,然后训练出更好的模型后共享使用,岂不美哉?
nono,现实中不是这样的
因为现实世界中,数据是属于用户的,我们既不能申请使用他们,同时还要保护数据的隐私性
提出问题
数据的协作和隐私问题,那有没有办法实现安全和高效的 数据合作呢?
历史
2016 年,Google 提出,在用户手机中训练模型,之后上传训练后的数据,替代直接上传隐私数据,一定程度上保证了个人数据的私密。
分类
横向联邦学习/特征对齐的联邦学习 | 纵向联邦学习/ 样本对齐的联邦学习 | 联邦迁移学习 | |
---|---|---|---|
参与者特点 | 业务相似,数据的特征重叠多,样本重叠少 | 样本重叠多,特征重叠少 | 样本、特征重合都不多 |
参与者例子 | 不同地区的两家银行 | 同一区域的银行和电商 | - |
说明 | 上传参数,在服务器中聚合更新模型,再将最新的参数下方,完成模型效果的提升 | (需要先进行样本对其,由于不能直接比对,我们需要加密算法的帮助RSA,让参与者在不暴露不重叠的样本的情况下,找出相同的样本后联合他们的特征进行学习) | 如果样本和特征重合都不多,希望利用数据提升模型能力,就需要将参与者的模型和数据迁移到同一空间中运算 |
前提:迁移学习
标签:重叠,模型,样本,笔记,学习,整理,联邦,数据 来源: https://blog.csdn.net/u010263423/article/details/118722785
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。