bert

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x Domain2022-02-22 12:31:37

课程关键字：Transformer、BERT、Dialogue Transformer、Rasa 3.x、Dialogue Policies、GraphComponent、TED Policy、UnexpecTEDIntentPolicy、RulePolicy、MemoizationPolicy、Ensemble 课程介绍：通过超过16小时对基于Transformer的Rasa智能业务对话机器人对话Policies的全
硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之：Rasa 3.x Rules2022-02-21 21:02:24

课程关键字：Transformer、BERT、Dialogue Transformer、Rasa 3.x、Dialogue Policies、GraphComponent、TED Policy、UnexpecTEDIntentPolicy、RulePolicy、MemoizationPolicy、Ensemble 课程介绍：通过超过16小时对基于Transformer的Rasa智能业务对话机器人对话Policies的全
硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x Domain2022-02-21 21:01:22

课程关键字：Transformer、BERT、Dialogue Transformer、Rasa 3.x、Dialogue Policies、GraphComponent、TED Policy、UnexpecTEDIntentPolicy、RulePolicy、MemoizationPolicy、Ensemble 课程介绍：通过超过16小时对基于Transformer的Rasa智能业务对话机器人对话Policies的全
硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之：Rasa 3.x部署安装初体验2022-02-21 16:34:07

课程关键词：NLP、Transformer、BERT、GPT、Bayesian、Rasa、Transfer learning、Conversational AI、Classifiers、 Policies、Dialogue Management、NER、Pre-training、Fine-tuning、DIET、TED、SimpleTOD、Bert-DST、ConveRT、Poly-Encoder、Chatbot、E2E、NLU、Policies、Micr
NLP（四十四）：BERT-flow2022-02-21 16:02:44

BERT-flow来自论文《On the Sentence Embeddings from Pre-trained Language Models》，中了EMNLP 2020，主要是用flow模型校正了BERT出来的句向量的分布，从而使得计算出来的cos相似度更为合理一些。由于笔者定时刷Arixv的习惯，早在它放到Arxiv时笔者就看到了它，但并没有什么兴趣，想不到前
几篇关于Transformer和Bert讲得不错的文章2022-02-10 21:33:47

这些关于Transformer和Bert的文章不错，做一下记录：《Transformer模型浅析》 https://zhuanlan.zhihu.com/p/74723305 文中引用了一篇国外的博客：https://jalammar.github.io/illustrated-transformer/ 另外关于这一句话：然后将结果除以（这样做的目的是得到更稳定的梯度）可以参
【深度学习】BERT -- 李宏毅PPT笔记2022-02-10 11:00:09

以下内容源自李宏毅机器学习课程
BERT书籍阅读笔记（二）PyTorch编程基础（1）2022-02-10 09:31:25

文章目录向量乘法张量间的操作控制模型每次训练的结果相同定义一个模型的基本步骤获取模型信息向量乘法（1）阿达玛积（Hadamard Product）定义为两个矩阵对应位置的元素进行相乘。 c = a * b （2）点积（Dot Product）矩阵相乘，第一个矩阵的列数必须等于第二个矩阵的行数
对比学习论文(持续更新)2022-02-05 18:35:16

最近老板让我去读对比学习的论文，我断断续续读了一些。在这里对读到的文章做一下整理，因为考试和假期这些论文也是比较久之前读的了，难免有所不足，请见谅。目录EMNLP 2021-SimCSE: Simple Contrastive Learning of Sentence EmbeddingsACL-2021-ConSERT: A Contrastive Framework fo
英伟达发布最新TensorRT8，性能提升200%2022-02-05 14:00:47

近日，英伟达悄悄地发布了TensorRT 8，BERT-Large推理仅需1.2毫秒！同时还加入了量化感知训练和对稀疏性的支持，实现了性能200%的提升。项目已开源。 2019年黄仁勋在GTC China正式发布了TensorRT 7，并称其是「我们实现的最大飞跃」。然而今年TensorRT 8的发布却十分低调。相比于7.
如何结合文本特征检测仇恨和攻击性语言2022-02-02 13:33:04

©原创作者 | 周鹏体验与资源链接： https：//github.com/sherzod-hakimov/HASOC-2021---Hate-Speech-Detection 论文： Combining Textual Features for the Detection of Hateful and Offensive Language 地址： https://arxiv.org/abs/2112.04803 摘要自从网络攻击成为一种攻击性
如何结合文本特征检测仇恨和攻击性语言2022-02-02 12:02:12

©原创作者 | 周鹏体验与资源链接： https：//github.com/sherzod-hakimov/HASOC-2021---Hate-Speech-Detection 论文： Combining Textual Features for the Detection of Hateful and Offensive Language 地址： https://arxiv.org/abs/2112.04803 摘要自从网络攻击成为一种攻击性
FLiText: A Faster and Lighter Semi-Supervised Text Classification with Convolution Networks2022-02-01 22:01:59

本文发表于EMNLP2020。本文提出了一个基于卷积模型的蒸馏方法，实现了一个轻量级的、快速的半监督文本分类框架FLiText，相比于Bert等大规模预训练模型，蒸馏模型更具备实际应用价值。 Method 模型总体的框架如下，大致分为激励网络和目标网络两部分：激励器网络（预训练语言模型）利
BERT-MRC：统一化MRC框架提升NER任务效果2022-02-01 19:31:09

©原创作者 | 疯狂的Max 01 背景命名实体识别任务分为嵌套命名实体识别（nested NER）和普通命名实体识别（flat NER），而序列标注模型只能给一个token标注一个标签，因此对于嵌套NER任务，需要使用两个以上的序列标注模型来完成标注任务。为了解决这一问题大部分人[1][2][3]用pipelined sys
ml52022-02-01 18:02:34

https://blog.csdn.net/qq_39309652/article/details/121008114 Jieba分词的原理是什么首先用正则表达式将中文段落粗略的分成一个个句子。将每个句子构造成有向无环图，之后寻找最佳切分方案。最后对于连续的单字，采用HMM模型将其再次划分。特征工程的常用方法对时间戳处理
pytorch_pretrained_bert将tensorflow模型转化为pytorch模型2022-01-29 23:00:36

参考：使用pytorch_pretrained_bert将tensorflow模型转化为pytorch模型_sunyueqinghit的博客-CSDN博客_bert tensorflow转pytorch 1. 下载bert安装包GitHub - google-research/bert: TensorFlow code and pre-trained models for BERT 2. 下载转换的py文件transformers/convert_be
机器学习与ML.NET–NLP与BERT2022-01-14 22:33:58

目录 1. 先决条件 2. 理解Transformers架构 3. BERT直觉 4. ONNX模型 5. 使用ML.NET实现 5.1 数据模型 5.2 训练该训练类是相当简单，它只有一个方法 BuildAndTrain它使用的路径，预先训练的模式。 5.3 预测器 5.4 助手和扩展 5.4 分词器 5.5 BERT 预测方法进行几个步骤。让我们更
【CS224n】(lecture11)Question Answering2022-01-14 22:00:30

学习总结文章目录学习总结一、QA介绍1.1 QA的分类：1.2 QA的框架1.3 QA在深度学习领域1.4 Beyond textual QA problems 二、阅读理解2.1 reading comprehension2.2 SQuAD数据集（1）SQuAD evaluation, v1.1（2）SQuAD 2.0 2.3 神经网络模型（1）LSTM-based vs BERT models（2）带注意力机制
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 的自我理解2022-01-14 20:59:22

1.Abstract 论文地址：https://arxiv.org/pdf/1810.04805.pdf Bert最近很火，主要用于表示转换器的双向解码器表示。是一个预训练的语言表征模型。以往的方法都是采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练。bert采用的是masked la
Bert预训练2022-01-02 22:01:24

Bert模型的目的：预训练Transformer的encoder网络，从而大幅提高准确率主要有两个任务： 1、预测被遮挡单词：随机遮挡一个词或多个词，让encoder根据上下文来预测被遮挡的单词 2、预测下一个句子：把两个句子放在一起，让encoder判断是否是原文中相邻的两个句子预测被遮挡单词：首先
论文解读：知识增强的预训练模型简介2021-12-28 23:30:59

©NLP论文解读原创•作者 | 杨健专栏系列概览该专栏主要介绍自然语言处理领域目前比较前沿的领域—知识增强的预训练语言模型。通过解读该主题具备代表性的论文以及对应的代码，为大家揭示当前最新的发展状况。为了能够和大家更好的分享自己的收获，笔者将遵循下面几个原则
【论文笔记】VL-BERT: PRE-TRAINING OF GENERIC VISUAL- LINGUISTIC REPRESENTATIONS2021-12-28 16:04:15

For tasks at the intersection of vision and language, there lacks such pre-trained generic feature representations. motivation：这篇文章和unified的思想很接近，希望训练出能够适应各类下游任务的通用表示模型。简介 To better exploit the generic representatio
NLP（三十三）：中文BERT字字量2021-12-28 10:04:46

中文字、词Bert向量生成利用Bert预训练模型生成中文的字、词向量，字向量是直接截取Bert的输出结果；词向量则是把词语中的每个字向量进行累计求平均（毕竟原生Bert是基于字符训练的），Bert预训练模型采用的是科大讯飞的chinese_wwm_ext_pytorch，网盘下载地址：链接：https://pan.baidu.com/s/1
Bert和一些以Bert为基础的预训练模型的Mask区别2021-12-26 09:31:23

• BERT: 提出了MLM和NSP两个任务。MLM随机的MASK掉一些token, 然后根据上下文预测这些token。NSP预测句子B是否是句子A的下一句。简单来说就是一个自监督的完形填空机制。后来有人提出WWM, 即当一个词中的某一个字被mask掉，整个词都被mask掉。 • ERNIE: 采用三种masking策略
BERT生成能力改进：分离对话生成和对话理解2021-12-25 23:01:21

©NLP论文解读原创•作者 | 吴雪梦Shinemon 研究方向 | 计算机视觉导读说明： NLP任务大致可以分为NLU（自然语言理解）和NLG（自然语言生成）两种，NLU负责根据上下文去理解当前用户的意图，方便选出下一步候选的行为，确定好行动之后，NLG模块会生成出对齐行动的回复；由于BERT引入Pre-train

首页 < 1 2 3 4 5 6 7 8 > 尾页

ICode9

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x Domain2022-02-22 12:31:37

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之：Rasa 3.x Rules2022-02-21 21:02:24

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x Domain2022-02-21 21:01:22

硅谷硬核Rasa课程、Rasa培训、Rasa面试系列之：Rasa 3.x部署安装初体验2022-02-21 16:34:07

NLP（四十四）：BERT-flow2022-02-21 16:02:44

几篇关于Transformer和Bert讲得不错的文章2022-02-10 21:33:47

【深度学习】BERT -- 李宏毅PPT笔记2022-02-10 11:00:09

BERT书籍阅读笔记（二）PyTorch编程基础（1）2022-02-10 09:31:25

对比学习论文(持续更新)2022-02-05 18:35:16

英伟达发布最新TensorRT8，性能提升200%2022-02-05 14:00:47

如何结合文本特征检测仇恨和攻击性语言2022-02-02 13:33:04

如何结合文本特征检测仇恨和攻击性语言2022-02-02 12:02:12

FLiText: A Faster and Lighter Semi-Supervised Text Classification with Convolution Networks2022-02-01 22:01:59

BERT-MRC：统一化MRC框架提升NER任务效果2022-02-01 19:31:09

ml52022-02-01 18:02:34

pytorch_pretrained_bert将tensorflow模型转化为pytorch模型2022-01-29 23:00:36

机器学习与ML.NET–NLP与BERT2022-01-14 22:33:58

【CS224n】(lecture11)Question Answering2022-01-14 22:00:30

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 的自我理解2022-01-14 20:59:22

Bert预训练2022-01-02 22:01:24

论文解读：知识增强的预训练模型简介2021-12-28 23:30:59

【论文笔记】VL-BERT: PRE-TRAINING OF GENERIC VISUAL- LINGUISTIC REPRESENTATIONS2021-12-28 16:04:15

NLP（三十三）：中文BERT字字量2021-12-28 10:04:46

Bert和一些以Bert为基础的预训练模型的Mask区别2021-12-26 09:31:23

BERT生成能力改进：分离对话生成和对话理解2021-12-25 23:01:21