将数据框列标题和值拆分为多个列

时间:2018-07-19 19:43:48

标签: python pandas azure-machine-learning-studio

我已将我的csv文件上传到Azure,但是由于某种原因,它变成了这样

 nominal;data;curs;cdx         Column 1
0          1;21.06.2000;28  2300;������ ���
1          1;22.06.2000;28  2200;������ ���
2          1;23.06.2000;28  1900;������ ���
3          1;24.06.2000;28  1700;������ ���
4          1;27.06.2000;28  1300;������ ���
5          1;28.06.2000;28  1100;������ ���

我基本上得到了两列,而不是四列nominaldatacurscdx,其中一列具有所有值,最后一列(为空或因为最后一列有编码问题)-不知道是什么。

我已这样删除列Column 1

import pandas as pd

def azureml_main(dataframe1 = None, dataframe2 = None):
    dataframe1.drop(['Column 1'], axis = 1, inplace = True)
    print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
    return dataframe1,

如何现在将第一列拆分为多个?要获得4个单独的列

我正在使用熊猫0.18

1 个答案:

答案 0 :(得分:1)

您需要使用以下内容拆分列:

dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)

然后通过以下方式更改标题:

dataframe1.columns = 'nominal;data;curs;cdx'.split(';')