让我再问一次这个问题,因为到目前为止在论坛上找到的答案对我没有帮助。
我正在尝试将列从“字符串”转换为“数字”数据类型。
该列没有缺失值,也没有错误,它来自CSV文件。为了进行记录,我尝试修改CSV文件上的列的格式类型并将其保存为数字,但是稍后在Azure ML上导入CSV文件时,它被编码为字符串。
到目前为止,我已经尝试了以下选项:
'执行Python脚本 t'。不幸的是,它不起作用。当我运行实验时,它将返回错误。我输入的代码是:
import pandas as df
def azureml_main (df):
df.age=pd.to_numeric(df.age,errors=’coerce’)
return df
使用“ 编辑元数据”模块。选择作为数据类型:“整数”或“浮点数”,但是在运行实验时,我总是遇到错误。
请让我知道您的想法。
感谢您的帮助。
约瑟夫·玛丽亚
P.S:这是我第二次在这个论坛上写作。我希望这次是精心制定的。 screenshot of 'Execute Python Script' error
答案 0 :(得分:2)
Python脚本似乎只需要稍作更新。 :)
这应该可行,因为您会自动获得dataframe1
作为pandas
数据帧。
import pandas as pd
def azureml_main(dataframe1 = None, dataframe2 = None):
dataframe1.age = pd.to_numeric(dataframe1.age, errors="coerce")
return dataframe1