我已将我的csv
文件上传到Azure,但是由于某种原因,它变成了这样
nominal;data;curs;cdx Column 1
0 1;21.06.2000;28 2300;������ ���
1 1;22.06.2000;28 2200;������ ���
2 1;23.06.2000;28 1900;������ ���
3 1;24.06.2000;28 1700;������ ���
4 1;27.06.2000;28 1300;������ ���
5 1;28.06.2000;28 1100;������ ���
我基本上得到了两列,而不是四列nominal
,data
,curs
,cdx
,其中一列具有所有值,最后一列(为空或因为最后一列有编码问题)-不知道是什么。
我已这样删除列Column 1
import pandas as pd
def azureml_main(dataframe1 = None, dataframe2 = None):
dataframe1.drop(['Column 1'], axis = 1, inplace = True)
print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
return dataframe1,
如何现在将第一列拆分为多个?要获得4个单独的列
我正在使用熊猫0.18
答案 0 :(得分:1)
您需要使用以下内容拆分列:
dataframe1['nominal;data;curs;cdx'].str.split(';',expand=True)
然后通过以下方式更改标题:
dataframe1.columns = 'nominal;data;curs;cdx'.split(';')