ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python-对于nlp.matcher.add方法,SpaCy的“ Matcher”(地名词典)格式如何工作?

2019-11-19 07:59:50  阅读:618  来源: 互联网

标签:spacy python


我已经开始使用Spacy.io的NLP包,并研究了一些介绍以及一些示例代码.

我对spacy.en.English.matcher.add方法很感兴趣-添加自己的实体的格式是什么?在解释了基本格式的同时,似乎还有其他功能可用.我添加的实体可以链接到dbpedia / wikipedia条目还是其他外部链接?

这是Spacy匹配器示例中的代码:
https://github.com/honnibal/spaCy/blob/master/examples/matcher_example.py

   nlp.matcher.add(
    "GoogleNow", # Entity ID: Not really used at the moment.
    "PRODUCT",   # Entity type: should be one of the types in the NER data
    {"wiki_en": "Google_Now"}, # Arbitrary attributes. Currently unused.
    [  # List of patterns that can be Surface Forms of the entity

        # This Surface Form matches "Google Now", verbatim
        [ # Each Surface Form is a list of Token Specifiers.
            { # This Token Specifier matches tokens whose orth field is "Google"
                ORTH: "Google"
            },
            { # This Token Specifier matches tokens whose orth field is "Now"
                ORTH: "Now"
            }
        ],
        [ # This Surface Form matches "google now", verbatim, and requires
          # "google" to have the NNP tag. This helps prevent the pattern from
          # matching cases like "I will google now to look up the time"
            {
                ORTH: "google",
                TAG: "NNP"
            },
            {
                ORTH: "now"
            }
        ]
    ]
)

感谢您的时间.

解决方法:

当然,您可以将它们链接起来,但是据我所知,spaCy并不是开箱即用的.您可以设置自己的类别类型(例如,SINGER而不是PRODUCT;请注意,该类别当前已损坏,您可能需要使用v0.93),然后在其中填充DBpedia条目(例如,David Bowie而不是Google Now).完成此操作后,您可以在实体及其URL之间使用映射.如该评论所示,可能会自动进行最后一个链接

 {"wiki_en": "Google_Now"}, # Arbitrary attributes. Currently unused.

标签:spacy,python
来源: https://codeday.me/bug/20191119/2034451.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有