用于NLP文本分类的AI模型的GCP部署

时间:2020-10-15 17:14:39

标签: python google-cloud-platform scikit-learn simpletransformers

我正在尝试在Google Cloud Platform上部署模型。但是我遇到了我创建存储桶以及我运行的文档中指定的相同问题:

gcloud ai-platform local predict --model-dir gs://bucket/ \
  --json-instances input.json \
  --framework SCIKIT_LEARN

但是出于同样的原因,它在模型的相同存储桶中找不到输入文件。因此,我已按照另一个question上的说明进行操作。我已经尝试将input.json处理到主目录中,但是由于其他原因,并未将json归类为json文件...

实际上,该模型是使用称为simpletransformers的库创建的,我尝试安装该库以进行成功测试。 我想知道最好的方法是什么?

input.json:

{ "document":{ "type":"PLAIN_TEXT", "content":"Protection plan costs, half of any delivery fee, and any Extras or young driver fee costs are always refunded."},"encodingType":"UTF8"}

1 个答案:

答案 0 :(得分:0)

根据documentation中的说明,该命令:

gcloud ai-platform local predict --model-dir local-or-cloud-storage-path-to-model-directory/ \
  --json-instances local-path-to-prediction-input.json \
  --framework name-of-framework

用于通过本地预测测试模型,并且期望在本地计算机而不是GCS存储桶中找到 input.json 文件。根据您提到的内容:

但是出于同样的原因,它无法在模型的同一存储桶中找到输入文件

我假设您期望它从GCS存储桶中读取它。但是它实际上应该是本地目录路径;在您的情况下,您执行的命令未指定路径,因此希望在执行命令的同一目录中找到 input.json 文件。我刚刚尝试过,对我来说效果很好。

我不确定您的意思是什么

我尝试将input.json压缩到主目录中,但由于其他原因,未将json归类为json文件...

但是我假设您也引用了GCS存储桶,但是,如前所述,您的 input.json 文件应该是本地路径,而不是GCS路径。 / p>