Textacy关键术语返回空列表

时间:2019-05-30 20:51:01

标签: python nlp spacy textacy

我想使用textacy来提取关键词,但是我正在使用keyterms.key_terms.pagerank(doc)的函数只是返回一个空列表。

我尝试了相关功能,包括较长的keyterms.key_terms_from_semantic_network(doc),但均未成功。我还尝试使用比下面显示的更长的文本,但仍然找不到任何关键术语。 textacy中的其他功能似乎确实起作用,因此仅对于keyterms类来说似乎是一个问题。

import spacy
import textacy
test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string)
textacy.keyterms.textrank(doc)

我得到的是一个空列表,而不是具有期望的术语和排名得分的元组列表。

2 个答案:

答案 0 :(得分:0)

这对我有用

请注意以下补充内容:

  1. 我在第2行中明确导入了关键词。
  2. 我在第4行中通过了spaCy英语模型。
import spacy
from textacy import keyterms

test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string, lang='en_core_web_sm')
textacy.keyterms.textrank(doc)

这是我从例句中得到的结果:

[('term', 0.24594541923542018),
 ('textacy', 0.24594541923542018),
 ('extraction', 0.2390545807645797),
 ('key', 0.13452729038228986),
 ('spacy', 0.13452729038228986)]

答案 1 :(得分:0)

这是一个示例,使用 2021 年 6 月的最新版本:

import spacy
from textacy.extract import keyterms as kt

test_string = "Textacy key term extraction is not working properly. Textacy is built on top of SpaCy."
doc = textacy.make_spacy_doc(test_string, lang='en_core_web_sm')
kt.textrank(doc)