ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

hanlp添加词典不起作用

2019-06-25 23:03:42  阅读:347  来源: 互联网

标签:不起作用 text HanLP System println txt hanlp 词典 out


不起作用的原因很多,这里列举几个

这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件          data下载地址https://pan.baidu.com/s/1o8Rri0y

 

1、没有删除custom文件夹下的所有bin文件

  当添加新词典后,没有删除原来自动生成的缓存词典,直接运行不成功。所以要删除这个文件

2、hanlp.properties中配置不对(注意这个文件的位置)

·  root=D:/Project/public_sentiment_monitor/plugin/项目名字(hanlp2)/

3、字典文本类型utf-8

4、添加的词典还要添加到CustomDictionaryPath中      如:

CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt;现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt; 机构名词典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;data/dictionary/custom/my.txt

5、字典内的文本不要有空格

  如:我爱我 家 n 1

这里我爱我家不能断

 

 

 

测试程序:

        String text = "比妳聰明的人,請不要讓他還比妳努力";
        System.out.println(HanLP.segment(text)); // 分词
        System.out.println(HanLP.extractKeyword(text, 2)); // 提取关键字,同时指定提取的个数
        System.out.println(HanLP.extractPhrase(text, 2)); // 提取短语,,同时指定提取的个数
        System.out.println(HanLP.extractSummary(text, 2)); // 提取摘要,同时指定提取的个数
        System.out.println(HanLP.getSummary(text,10));  //提取短语,同时指定摘要的最大长度
        System.out.println(HanLP.convertToTraditionalChinese(text)); // 简体字转为繁体字
        System.out.println(HanLP.convertToSimplifiedChinese(traditionText)); // 繁体字转为简体字
        System.out.println(HanLP.convertToPinyinString(text, " ", false)); // 转为拼音

 

 

 

 

参考:https://www.cnblogs.com/hufulinblog/p/10025933.html

标签:不起作用,text,HanLP,System,println,txt,hanlp,词典,out
来源: https://www.cnblogs.com/51python/p/11087204.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有