如何使用gcloud CLI工具将谷歌自然语言与葡萄牙语句子一起使用?

时间:2017-12-26 21:27:05

标签: nlp google-cloud-platform gcloud google-cloud-nl

我使用了这个命令:

“gcloud ml language analyze-syntax --language = pt-br --content =”Capítulo“

并收到此错误:

错误:(gcloud.ml.language.analyze-syntax)无法读取命令行参数[--content = Cap \ xedtulo],因为它似乎不是有效的7位ASCII。

gcloud ml语言要分析 - 语法--content = Cap \ sedtulo                                                      ^无效字符

但是,如果我使用演示工具(https://cloud.google.com/natural-language/?hl=pt-br),我会得到正确的答案。

为什么呢?如何将谷歌自然语言与葡萄牙语或西班牙语等口音语言一起使用?

1 个答案:

答案 0 :(得分:0)

免责声明:我使用Google云平台支持。

显然这可能是一个内部问题,这就是为什么我会与适当的调查小组一起提出这个问题。我会在我的回答中发表评论,链接正确的Google Public Issue Tracker page

<强>为什么吗

如果运行以下命令,则可以获得有关此错误的更多信息:

gcloud ml language analyze-syntax --content-file=analyze_test.txt --verbosity=debug 

analyze_test.txt包含

  

Capítulo

抛出的错误:

File "/google/google-cloud-sdk/lib/third_party/apitools/base/protorpclite/messages.py", line 1541, in validate_element
    raise validation_error
ValidationError: Field content encountered non-ASCII string 'Cap\xc3\xadtulo\n': 'ascii' codec can't decode byte 0xc3 in position 3: ordinal not in range(128)

表明,在gcloud ml与此库通信时,缺少编码规范。缺少编码,库保护自己免受未知字符(7-bit ASCII characters除外)。

正如documentation建议的那样,应该使用此命令进行实验,或使用极短文本。在生产中或在应用程序中,应该使用APIs