如何格式化凌乱的数据集?

时间:2019-07-11 19:38:03

标签: python python-3.x multi-index data-cleaning dataformat

我的问题的当前格式如下:

其中'HOODNUM', 'HOODNAM', 'ENUM_FSA' , 'Unnamed:1'是列。

我的目标是按照以下方式格式化数据:

HOODNUM   HOODNAM                     ZipCode
1         West Humber-Clairville .    M9V
1         West Humber-Clairville      M9W

如何使用python解决此问题?

我尝试过

df = df.stack()
df = pd.DataFrame(data=df)

导致:

HOODNUM  HOODNAME                                     
1        West Humber-Clairville      
                                            ENUM_FSA      M9V
                                            Unnamed: 1    M9W
带有HOODNUMHOODNAME

是索引,但是它并不是我想要的格式。

df = df.set_index(['HOODNUM','HOODNAME'])
df = df.stack()
df = pd.DataFrame(data=df)

0 个答案:

没有答案