corenlp(python包装器)如何处理非ascii字符串

时间:2015-09-08 18:21:29

标签: python

我使用Dustin Smith的Python包装器来获取Stanford Core NLP工具v3.4.1

我将'Víctor'这个词放入corenlp.parse。 'Víctor'包含非ascii字符。我想得到'Víctor'的引理。但是当我放corenlp.parse('Víctor')时。它给出了错误:

  

UnicodeDecodeError:'ascii'编解码器无法解码位置1中的字节0xc3:序数不在范围内(128)。

如何更改corenlp设置,以便corenlp可以处理非ascii字符串?

1 个答案:

答案 0 :(得分:0)

在将非ascii放入corenlp之前使用unidecode