ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

推荐系统CTR预估模型之Deep Interest Network(Din)

2019-05-18 17:55:27  阅读:587  来源: 互联网

标签:Din Network candidate 用户 CTR 特征向量 兴趣 ad


 Deep Interest Network(Din)模型是阿里妈妈基础算法团队发表在KDD 18上的一篇论文,用来做CTR预估。

 文章的innovation也很简单,在电商场景的广告推荐中,用户的兴趣非常重要,而用户的兴趣从算法测一般通过用户历史浏览点击的一些商品来进行刻画,目前的主流DNN模型都是直接把用户的一些兴趣(可以是一些用户历史浏览点击的商品,keyword等feature)直接做一个embedding,映射成一个fixed-length的Dense vector,然后输入到DNN模型。这样做有一个缺点,就是对于用户将要浏览的不通商品(candidate ad),这样做获得的embedding向量是一样的,事实上这样做不是太好,比如我们很容易想到,假如兴趣是时序的,那一般我们都会认为最近的兴趣一般会对用户的当前行为影响更大,可能会对时间做一个简单的权重衰减之类的,那Din是怎么做的呢?

 Din calculates the representation vector of user interests by taking into consideration the relevance of historical behaviors given a candidate ad. It pays attentions to the releated parts of historical behaviors and takes a weighted sum pooling to obtain the representation of user interests with respect to the candidate ad, In this way, the repressentation vector of user interests varies over different ads. Din可以根据不同的candidate ad计算得到不同的特征向量,为什么这么做呢? e.g. 一个年轻的妈妈最近浏览了一些商品,包括毛呢大衣,T恤,耳环,手提袋,皮包和小孩的衣服。 那按以前的做法,不管这个用户将要看什么商品,对他的影响都是一样,取一个平均, 但是这样与实际情况显然不符合, 假如该用户现在有在看大衣, 那她历史浏览点击大衣的行为相比她历史对T恤,耳环等这些商品的行为 对她将要买什么大衣的行为影响肯定会大一些,也就是说,用户历史的多种多样的兴趣对于用户当前的candidate ad 可以被locally activated.
在这里插入图片描述
 上图,左边是base model,其实就是对所有的用户兴趣做一个sum/average/sqrtn pooling,而对于右边是Din,Din对用户的兴趣,和当前的candidate ad(也可以结合自身业务和对模型理解用其他的)做一个attention,这个attention其实很简单, 可以看成一个简单的神经网络,用用户的历史兴趣的特征向量(keys),和当前candidate ad 的特征向量(querys), 做一个简单的(keys, keys-querys, querys, keys*querys), 然后过一个自定义的简单的DNN,最后这个输出当成最后的特征向量,这样对于不同的candidate ad,这个特征向量是不同的(attention)。
在这里插入图片描述
模型的tensorflow实现代码可以参考: https://github.com/qiaoguan/deep-ctr-prediction/tree/master/Din
参考文献:【1】Guorui Zhou et all. “Deep Interest Network for Click-Through Rate Prediction,” In KDD,2018.

标签:Din,Network,candidate,用户,CTR,特征向量,兴趣,ad
来源: https://blog.csdn.net/hnu2012/article/details/90317684

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有