ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

基于Tag标签的推荐-推荐系统

2020-12-14 21:31:59  阅读:211  来源: 互联网

标签:基于 log 文娱 标签 推荐 用户 Tag


推荐系统-基于Tag标签的推荐

文章目录

个人介绍

杨晓栋,对世界保持好奇心。

可以使用Tensorflow,进行一些基础模型的搭建,修改和训练工作。

与叶言威,刘瀚乾同学一起努力完成一项大创项目。

未来希望可以有一家属于自己的书店。

基于标签的推荐

​ 基于标签的推荐在我们的生活中很常见。音乐网站,豆瓣,视频网站,这些与文娱相关的网站,随处可见标签的影子。豆瓣的电影标签、书籍标签,网易云音乐的音乐标签,B站的视频标签。属于基于内容的推荐算法。

​ 推荐系统遇到信息过载的时候才有必要,很显然,当书店是一个小书店的时候,书并不多,也不需要推荐系统,只需要简单的分类即可。

​ 我们这里主要讲一个简单的基于标签的推荐算法。

SimpleTagBased

p ( u , i ) = ∑ b n u , b n b , i p(u, i)=\sum_{b} n_{u, b} n_{b, i} p(u,i)=b∑​nu,b​nb,i​
​ $n_{u, b} 是 用 户 是用户 是用户u 打 过 标 签 打过标签 打过标签b 的 次 数 , 的次数, 的次数,n_{b, i} 是 物 品 是物品 是物品i 被 打 过 标 签 被打过标签 被打过标签b$的次数。通过标签将用户将物品连接起来。可解释强,会让读者觉得标签是有道理的,基于标签推荐出书也是有道理的。

在这里插入图片描述

而标签这种特征表现形式,建立起用户和商品联系,标签是联系用户和物品的纽带。

TagBasedTFIDF

p ( u , i ) = ∑ b n u , b log ⁡ ( 1 + n b ( u ) ) n b , j p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} n_{b, j} p(u,i)=b∑​log(1+nb(u)​)nu,b​​nb,j​
​ SimpleTagBased不能反应用户个性化的兴趣,这里我们可以借鉴TF-IDF的思想,对这一公式进行改进。 n b ( u ) n_{b}^{(u)} nb(u)​记录了标签 b b b被多少用户使用过

TagBasedTFIDF++

p ( u , i ) = ∑ b n u , b log ⁡ ( 1 + n b ( u ) ) n b , i log ⁡ ( 1 + n i ( u ) ) p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)} p(u,i)=b∑​log(1+nb(u)​)nu,b​​log(1+ni(u)​)nb,i​​
​ 同理我们可以再加入对热门物品进行惩罚。 n b ( u ) n_{b}^{(u)} nb(u)​记录了标签 b b b被多少用户使用过, n i ( u ) n_{i}^{(u)} ni(u)​记录了物品 i i i被多少用户标记过。

文娱推荐举例——视频

p ( u , i ) = ∑ b Q n u , b log ⁡ ( 1 + n b ( u ) ) n b , i log ⁡ ( 1 + n i ( u ) ) R p(u, i)=\sum_{b} {Q}\frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)}{R} p(u,i)=b∑​Qlog(1+nb(u)​)nu,b​​log(1+ni(u)​)nb,i​​R
​ 再加入我们考虑视频本身的质量因素 R R R(可以是带时间衰减的观看次数,也可以是上线之后的CTR),再考虑标签本身的质量 Q Q Q

文娱推荐举例——豆瓣

​ 对用户进行了引导,豆瓣利用标签讲用户的推荐结果作了聚类,显示了对不同标签下用户的推荐结果,增加了推荐的多样性和可解释性。

​ 最终组织页面,提高了推荐结果的多样性,因为读者的兴趣可能在长时间是广泛的,但是某一天比较具体,我们想要在某一天击中用户当天的兴趣,通过标签云,展示了所有读者的兴趣,让读者根据他今天的兴趣去选择相关的标签,得到参考结果,提高了推荐结果的多样性,是推荐结果更容易满足用户多样的兴趣。

总结和个人看法

​ 基于标签的推荐属于基于内容的推荐算法。

基于内容的推荐优点如下:

  • 用户之间的独立性。
  • 好的可解释性
  • 新的item可以立刻得到推荐

基于内容的推荐缺点如下:

  • item的特征抽取一般很难。优质的社区,会贡献优质的Tag,实现良性循环,一些电影,书的Tag是人类主观上,高层次的抽取。
  • 无法挖掘出用户的潜在兴趣。最后的组织页面在一定程度上解决这个问题(实质上没有解决)。
  • 无法为新用户产生推荐。在注册时让用户选一些标签。

​ 基于上面的分析,我认为对于文娱的推荐,基于标签的是不错的选择。文娱类作品区别于电商产品,文娱网站中的电影,书,视频是有内容的,自身都有区别与其他作品的特性,没有哪个作家希望自己的书和别人完全相同,而这些作品也有着一些共性,是有温度的,而用户的这些标签,像是书签,注脚,提炼概况他的内容。这些作品会容易引起人们的共鸣,优质的社区会有同样会有优质的评价和Tag。顾客和读者也就愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。

​ 因此我认为对于文娱的推荐,基于标签的推荐是不错的选择

愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。

​ 因此我认为对于文娱的推荐,基于标签的推荐是不错的选择

参考资料:《推荐系统实践》

标签:基于,log,文娱,标签,推荐,用户,Tag
来源: https://blog.csdn.net/qq_45175218/article/details/111186190

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有