Question

我已将我的csv文件上传到Azure，但是由于某种原因，它变成了这样

 nominal;data;curs;cdx         Column 1
0          1;21.06.2000;28  2300;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½
1          1;22.06.2000;28  2200;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½
2          1;23.06.2000;28  1900;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½
3          1;24.06.2000;28  1700;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½
4          1;27.06.2000;28  1300;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½
5          1;28.06.2000;28  1100;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½

我基本上得到了两列，而不是四列nominal，data，curs，cdx，其中一列具有所有值，最后一列（为空或因为最后一列有编码问题）-不知道是什么。

我已这样删除列Column 1

import pandas as pd

def azureml_main(dataframe1 = None, dataframe2 = None):
    dataframe1.drop(['Column 1'], axis = 1, inplace = True)
    print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
    return dataframe1,

如何现在将第一列拆分为多个？要获得4个单独的列

我正在使用熊猫0.18

Answer 1

您需要使用以下内容拆分列：

dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)

然后通过以下方式更改标题：

dataframe1.columns = 'nominal;data;curs;cdx'.split(';')

将数据框列标题和值拆分为多个列

1 个答案: