我使用Dustin Smith的Python包装器来获取Stanford Core NLP工具v3.4.1
我将'Víctor'这个词放入corenlp.parse
。 'Víctor'包含非ascii字符。我想得到'Víctor'的引理。但是当我放corenlp.parse('Víctor')
时。它给出了错误:
UnicodeDecodeError:'ascii'编解码器无法解码位置1中的字节0xc3:序数不在范围内(128)。
如何更改corenlp设置,以便corenlp可以处理非ascii字符串?
答案 0 :(得分:0)
在将非ascii放入corenlp之前使用unidecode