同一行中的拆分值在同一列中的多个列中形成df?

时间:2019-05-18 20:12:51

标签: python pandas

我的数据框有一列包含一些值,这些值可以出现在所有行中,但不是必需的。 我想将此值拆分为不同的行,如果该列中的值为apper,则将其放置为1

我正在使用python 3,而df是:

data = {'Amenities':[{'TV', 'Wifi'}, {'TV',"Cable TV",'Internet','Wifi'},
                     {'Internet','Wifi'}]}  
df2 = pd.DataFrame(data) 
df2

    Amenities
0   {TV, Wifi}
1   {TV, Cable TV, Wifi, Internet}
2   {Wifi, Internet}

我想以这种方式查看表格:

data = {'Amenities':[{'TV', 'Wifi'}, {'TV',"Cable TV",'Internet','Wifi'},
                     {'Internet','Wifi'}],
        'TV':[1,1,0],
        'Cable TV':[0,1,0],
        'Wifi':[1,1,1],
        'Internet':[0,1,1],
       }  
df2 = pd.DataFrame(data) 
df2

    Amenities   TV  Cable TV    Wifi    Internet
0   {TV, Wifi}  1   0   1   0
1   {TV, Cable TV, Wifi, Internet}  1   1   1   1
2   {Wifi, Internet}    0   0   1   1

1 个答案:

答案 0 :(得分:1)

在您使用get_dummies然后使用concat的情况下

s=pd.get_dummies(df2.Amenities.apply(list).apply(pd.Series),prefix = '',prefix_sep = '').sum(level=0,axis=1)
s
Out[66]: 
   Cable TV  Internet  TV  Wifi
0         0         0   1     1
1         1         1   1     1
2         0         1   0     1
df=pd.concat([df2,s],axis=1)
df
Out[68]: 
                        Amenities  Cable TV  Internet  TV  Wifi
0                      {TV, Wifi}         0         0   1     1
1  {Cable TV, Internet, Wifi, TV}         1         1   1     1
2                {Internet, Wifi}         0         1   0     1