正如另一个stackoverflow用户所建议的那样,我使用sklearn预处理包来规范化pandas数据帧的列。我从一个看起来像这样的文件创建这个数据框:
0.0 1.0 4.0
0.0 10.0 4.356
以下代码工作得很好:
min_max_scaler = preprocessing.MinMaxScaler()
x = pd.read_csv("input-file")
x_scaled = min_max_scaler.fit_transform(x)
x= pd.DataFrame(x_scaled)
x.to_csv("output-file", sep=" ", index=False, header=False)
应该从文件创建数据帧,规范化数据帧并将结果保存到新文件。但是出于这个错误出现的地方没有,我不知道如何摆脱它:
ValueError: invalid literal for float(): 0 0.0 0.0 0.0 364.0
我更改了文件删除了额外的字符(如果有任何类似\n
)但仍无法正常工作。知道为什么会这样吗?我错过了什么吗?
由于
pd.read_csv("path")
x_scaled = min_max_scaler.fit_transform()
messageTrainDf = pd.DataFrame(x_scaled)
messageTrainDf.to_csv("path", sep=" ", index=False, header=False)