在AWS sagemaker上进行模型测试“无法将字符串转换为浮点型”

时间:2018-10-05 19:28:39

标签: data-science amazon-sagemaker

XGboost模型已在AWS sagemaker上进行了训练并成功部署,但我不断收到以下错误: ModelError:调用InvokeEndpoint操作时发生错误(ModelError):从模型收到消息““的客户端错误(415)无法将字符串转换为float:“。 有什么想法吗?

Test data is as following:
      size       mean
269   5600.0  17.499633
103   1754.0   9.270272
160   4968.0  14.080601
40       4.0  17.500000
266  36308.0  11.421855

test_data_array = test_data.drop(['mean'], axis=1).as_matrix()
test_data_array = np.array([np.float32(x) for x in test_data_array])
xgb_predictor.content_type = 'text/csv'
xgb_predictor.serializer = csv_serializer

def predict(data, rows=32):
    split_array = np.array_split(data, int(data.shape[0] / float(rows) + 1))
    #print(split_array)
    predictions = ''

    for array in split_array:
        print(array[0], type(array[0]))
        predictions = ','.join([predictions, xgb_predictor.predict(array[0]).decode('utf-8')])

    return np.fromstring(predictions[1:], sep=',')

predictions = predict(test_data_array)

1 个答案:

答案 0 :(得分:0)

SageMaker XGBoost无法处理带有标头的csv输入。在将数据发送到端点之前,请确保已删除字符串头。

对于csv预测,SageMaker XGBoost还假定CSV输入不包含标签列。因此,请同时删除输入数据中的标签列。