文字清理问题

时间:2018-11-21 08:20:15

标签: python text nlp topic-modeling

我正在在线学习使用python进行文本清理。 我摆脱了一些停用词并降低了字母。

但是当我执行这段代码时,它什么也没显示。

我不知道为什么。

# we add some words to the stop word list
texts, article = [], []
for w in doc:
    # if it's not a stop word or punctuation mark, add it to our article!
    if w.text != '\n' and not w.is_stop and not w.is_punct and not w.like_num and w.text != 'I':
        # we add the lematized version of the word
        article.append(w.lemma_)
    # if it's a new line, it means we're onto our next document
    if w.text == '\n':
        texts.append(article)
        article = []

当我尝试输出文本时,它只是空白。

1 个答案:

答案 0 :(得分:0)

我相信“文本”列表和“文章”列表是指相同的内容,因此清除一个列表的内容也会清除另一个列表。

以下是指向类似问题的链接:Python: Append a list to another list and Clear the first list

请查看以上内容是否有用。