标签:Multi Shot Network 利用 结果 查询 FewRel 原型 query
作者:魏启凯 单位:燕山大学
论文:https://arxiv.org/pdf/1906.06678.pdf
code:https://github.com/ZhixiuYe/MLMAN
来源:ACL2019
创新:
- 提出一种多级匹配和聚合网络,以交互的方式来encode查询集实例和类原型。
- 设计了一种辅助loss function。
问题定义:
小样本任务是最近两年流行起来的任务,训练集和测试集均分支持集和查询集。
5-way 1-shot
支持集5个类,每个类1个样本,用来训练模型,利用查询集的一个句子来计算其属于支持集中5个类别之一。
MLMAN模型
其中,encoder是利用CNN来做,
Local Matching and aggregation是一个局部匹配网络,输入K个支持集实例和一个query,利用注意力机制收集他们之间的局部信息,接着利用embedding代表进行聚合的信息。
instance maching and aggregation 是利用MLP来计算每个query和K个support 之间的匹配信息。接着将权重加起来得到最终的类原型。
class matching 利用一个MLP来计算query和类原型之间的距离。
计算过程
首先聚合K个支持集的实例为一个矩阵C
Q是查询句子的矩阵
接着通过拼接的方式得到新的Q和C
再将最大池化和平均池化引入进来,有利于后面做消融实验。
最终得到类原型向量s。
实验结果
FewRel的baselinehttps://thunlp.github.io/1/fewrel1.html,平台提供5way1shot,5way5shot,10way1shot,10way5shot的结果。
测试结果是在FewRel测试集的结果,现在清华官方提供了测试集。
下面是消融实验
验证集的结果是在FewRel 验证集上的结果。
标签:Multi,Shot,Network,利用,结果,查询,FewRel,原型,query 来源: https://blog.csdn.net/u011150266/article/details/116192751
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。