从S3创建DataSource时出现AWS Machine Learning错误

时间:2017-10-27 08:09:27

标签: amazon-web-services amazon-s3 machine-learning amazon-machine-learning

尝试从S3自动创建AWS DataSource时出错: 我正在运行一个shell脚本:

#!/bin/bash 
for k in 1 2 3 4 5 
do
        aws machinelearning create-data-source-from-s3 --cli-input-json file://data/cfg/dsrc_training_00$k.json
        aws machinelearning create-data-source-from-s3 --cli-input-json file://data/cfg/dsrc_validate_00$k.json 
done

以下是它引用的json文件的示例:

{
   "DataSourceId": "Iris_training_00{k}",
   "DataSourceName": "[DS Iris] training 00{k}",
   "DataSpec": {
      "DataLocationS3": "s3://ml-test-predicto-bucket/shuffled_{k}.csv",
      "DataSchemaLocationS3": "s3://ml-test-predicto-bucket/dsrc_iris.csv.schema",
      "DataRearrangement": {"splitting":{"percentBegin" : 0, "percentEnd" : 70}}
   },
   "ComputeStatistics": true
}

但是当我从命令行运行脚本时,我收到错误:

Parameter validation failed:
Invalid type for parameter DataSpec.DataRearrangement, value: {u'splitting': {u'percentEnd': u'100', u'percentBegin': u'70'}}, type: <type 'dict'>, valid types: <type 'basestring'>

有人可以帮忙,我看过API AWS ML文档,我认为我做的一切都正常,但我似乎无法解决这个错误......非常感谢!

1 个答案:

答案 0 :(得分:1)

DataRearrangement 元素需要 JSON String 对象。您正在传递字典对象。

更改:

"DataRearrangement": {"splitting":{"percentBegin" : 0, "percentEnd" : 70}}

<强> [到]

"DataRearrangement": "{\"splitting\":{\"percentBegin\":0,\"percentEnd\":70}}"