我正在尝试将数据框csv加载到spacy管道中。我在这里得到参数字符串错误是我的代码。
from __future__ import unicode_literals
nlp = spacy.load('en')
data = pd.read_csv("sometextdata.csv")
text = []
for line in data.Line:
text.append(clean_text(line))
text_spacy = nlp(data['Line'])
data['Line'].apply(nlp)
document = nlp(text)
TypeError: Argument 'string' has incorrect type (expected unicode, got str)
我尝试以不同的方式加载我遇到同样的错误。
平台:操作系统 - Mac和python 2.7
答案 0 :(得分:1)
您应该将变量文本转换为unicode。你现在可以看到str类型。例如,您可以尝试转换为
document = nlp(unicode(text))
或喜欢
document = nlp(text.decode())