使用Azure Machine Learning Studio更改数据类型

时间:2018-08-03 08:08:55

标签: azure azure-machine-learning-studio

让我再问一次这个问题,因为到目前为止在论坛上找到的答案对我没有帮助。

我正在尝试将列从“字符串”转换为“数字”数据类型。

该列没有缺失值,也没有错误,它来自CSV文件。为了进行记录,我尝试修改CSV文件上的列的格式类型并将其保存为数字,但是稍后在Azure ML上导入CSV文件时,它被编码为字符串。

到目前为止,我已经尝试了以下选项:

  • '执行Python脚本 t'。不幸的是,它不起作用。当我运行实验时,它将返回错误。我输入的代码是:

    import pandas as df
    
    def azureml_main (df):
      df.age=pd.to_numeric(df.age,errors=’coerce’)
    
    return df
    
  • 使用“ 编辑元数据”模块。选择作为数据类型:“整数”或“浮点数”,但是在运行实验时,我总是遇到错误。

请让我知道您的想法。

感谢您的帮助。

约瑟夫·玛丽亚

P.S:这是我第二次在这个论坛上写作。我希望这次是精心制定的。 screenshot of 'Execute Python Script' error

1 个答案:

答案 0 :(得分:2)

Python脚本似乎只需要稍作更新。 :)

这应该可行,因为您会自动获得dataframe1作为pandas数据帧。

import pandas as pd

def azureml_main(dataframe1 = None, dataframe2 = None):
  dataframe1.age = pd.to_numeric(dataframe1.age, errors="coerce")

  return dataframe1