Azure MachineforMachine Learning的测试数据中缺少数据

时间:2016-01-21 11:57:44

标签: python azure azure-machine-learning-studio

我是Azure机器学习的新手。我创建了一个训练实验,其中训练数据有一些缺失值。处理缺失数据和其他一些转换的逻辑是Python代码,它可以处理这些数据。

现在我想要测试数据一样。我已将实验部署为Web服务。因此,为输入和输出数据生成模式(所有都是数字字段)。

两个问题: 1.它要求我定义测试数据的标签,否则它会给出不一致的列数错误,因为测试数据中缺少标签列。 2.我在测试数据中有一些缺失的数据,理想情况下,实验中的Python脚本应该注意。但是由于架构,它给了我以下错误。

The request failed with status code: 400
Content-Length: 323
Content-Type: application/json; charset=utf-8
Server: Microsoft-HTTPAPI/2.0
Date: Thu, 21 Jan 2016 11:44:49 GMT
Connection: close

{u'error': {u'message': u'Invalid argument provided.', u'code': 'BadArgument', u'details': [{u'message': u'Parsing of input vector failed.  Verify the input vector has the correct number of columns and data types.  Additional details: Value was either too large or too small for an Int32..', u'code': u'InputParseError', u'target': u'input1'}]}}

1 个答案:

答案 0 :(得分:1)

@Sagar,

u'message': u'Parsing of input vector failed.  Verify the input vector has the correct number of columns and data types.  

Additional details: Value was either too large or too small for an Int32..', u'code': u'InputParseError',

形成错误消息,我建议您确保列号和数据类型必须与输入数据匹配。例如, 如果您有十进制数,请使用Double数据类型而不是Integer。 此外,您可以发布定义的列和数据类型,甚至是您的测试数据以获取进一步的步骤。