我正在尝试使用Python3(collab)上的python客户端来分析带重音字符的文本。我正在设置类型为PLAIN_TEXT的文档对象。
# Run a sentiment analysis request on text
def nlp_analyze_text(text, lang=nlp_def_language):
client = language.LanguageServiceClient()
document = types.Document(
content=text,
language=lang,
type=enums.Document.Type.PLAIN_TEXT)
entities = client.analyze_entities(document=document, encoding_type='UTF32')
syntax = client.analyze_syntax(document=document)
return (entities, syntax)
同样,输入到客户端的输入包含多字节字符。
text = u"Mi vieja mula ya no es lo que era? Qué era entonces? Era de Bs.As. Saludos!"
nlp_analyze_text(text)
我相信Google Cloud NL无法正确理解这一点。
sentences {
text {
content: "Qu\303\251 era entonces?"
begin_offset: -1
}
}
因此,我应该如何设置代码来分析带有重音字符的文本。
谢谢
答案 0 :(得分:0)
毕竟,我正在查看转义字符,因为要打印的对象如何实现其 str 实现。当我打印更深的属性时,我看到字符串未转义。
希望这篇文章对其他人有帮助。