我正在尝试通过假匹配器MedDra PT。当我添加到匹配器标签和模式时,我得到以下信息:ValueError:[T002]模式长度(10)> =短语_matcher.max_length(10)。即使我使用有条件的,如果最多采用5个字符串的模式。我也尝试过更改词组匹配器的max_length。有人可以帮忙或有什么想法可以在PT中映射标签。我正在使用spacy-2.0.18版本。
nlp = spacy.load('en_core_web_sm')
if 'ner' not in nlp.pipe_names:
ner = nlp.create_pipe('ner')
nlp.add_pip(ner)
else:
ner = nlp.get_pipe('ner')
label = 'PT'
ner.add_label(label)
matcher = PhraseMatcher(nlp.vocab)
for i in MEDDRA.all_concepts():
if(i.meddra_type == 'PT'):
if(len(i.term.split())<5):
matcher.add(label, None, nlp(i.term))