ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

【AllenNLP入门教程】: 1、基于Allennlp2.4版本的文本分类

2021-07-25 19:06:34  阅读:324  来源: 互联网

标签:bert Allennlp2.4 -- text 入门教程 train allennlp classifier AllenNLP


前言

之前写过【AllenNLP】专栏学习allennlp 框架的一个入门中文教程,最近看的时候发现现在的版本已经从0.8升级到2.6了,升级内容见这里Upgrade guide from 1.x ➡️ 2.0,可以看到有很多内容已经不适应了,所以根据官网最近的教程写了新的中文教程。

本教程可以实现:基于movie review 的文本分类,包括:
1、使用python脚本train、eval、predict
2、使用Allennlp命令行train、eval、predict
3、分别使用lstm模型、bert模型进行训练

代码

代码在:https://github.com/JackKuo666/learn_allennlp_get_start

内容

1.依赖

注意:这里使用以下版本可以跑通,我安装python3.6或
allennlp2.6都出现不同的版本问题。

python == 3.8.0

allennlp == 2.4.0

pip install allennlp -i https://pypi.tuna.tsinghua.edu.cn/simple

2.训练

2.1 使用脚本训练

train

python train.py

eval

python evaluate.py

predict

python predict.py

2.2 使用 allennlp train 训练 embedding+bag_of_embedding

train

allennlp train scripts/my_text_classifier.jsonnet --serialization-dir checkpoint --include-package my_text_classifier

eval

allennlp evaluate checkpoint/model.tar.gz data/movie_review/test.tsv --include-package my_text_classifier

predict

allennlp predict checkpoint/model.tar.gz data/movie_review/test.jsonl --include-package my_text_classifier --predictor sentence_classifier

2.3 使用 allennlp train 训练 bert embedding+bert pool

这里需要下载bert预训练模型放到``bert_pretrain`文件夹下

train

allennlp train scripts/my_text_classifier_bert.jsonnet --serialization-dir checkpoint_bert --include-package my_text_classifier

eval

allennlp evaluate checkpoint_bert/model.tar.gz data/movie_review/test_small.tsv --include-package my_text_classifier

predict

allennlp predict checkpoint_bert/model.tar.gz data/movie_review/test.jsonl --include-package my_text_classifier --predictor sentence_classifier

标签:bert,Allennlp2.4,--,text,入门教程,train,allennlp,classifier,AllenNLP
来源: https://blog.csdn.net/weixin_37251044/article/details/119085772

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有