如何在spacy管道nlp中加载Data Frame或csv文件?

时间:2017-08-29 05:21:37

标签: python python-2.7 pandas nlp spacy

我正在尝试将数据框csv加载到spacy管道中。我在这里得到参数字符串错误是我的代码。

from __future__ import unicode_literals
nlp = spacy.load('en')

data = pd.read_csv("sometextdata.csv")
text = []
for line in data.Line:
    text.append(clean_text(line))

    text_spacy = nlp(data['Line'])
    data['Line'].apply(nlp)
    document = nlp(text)
TypeError: Argument 'string' has incorrect type (expected unicode, got str)

我尝试以不同的方式加载我遇到同样的错误。

平台:操作系统 - Mac和python 2.7

1 个答案:

答案 0 :(得分:1)

您应该将变量文本转换为unicode。你现在可以看到str类型。例如,您可以尝试转换为

document = nlp(unicode(text))

或喜欢

document = nlp(text.decode())