应用错误收集

corenlp（python包装器）如何处理非ascii字符串

时间：2015-09-08 18:21:29

标签： python

我使用Dustin Smith的Python包装器来获取Stanford Core NLP工具v3.4.1

我将'Víctor'这个词放入corenlp.parse。 'Víctor'包含非ascii字符。我想得到'Víctor'的引理。但是当我放corenlp.parse('Víctor')时。它给出了错误：

UnicodeDecodeError：'ascii'编解码器无法解码位置1中的字节0xc3：序数不在范围内（128）。

如何更改corenlp设置，以便corenlp可以处理非ascii字符串？

1 个答案:

答案 0 :(得分：0)

在将非ascii放入corenlp之前使用unidecode