自动将数据存储在数据框中以传输到perfomr EDA

时间:2018-09-15 17:55:46

标签: python pandas dataframe exploratory

我有这样的数据。我想创建此数据的图形以使用python执行EDA。如何存储这些数据,以便我可以轻松执行EDA?

party       infants
democrat    y          156
            n          102
            ?            9
republican  n          134
            y           31
            ?            3

这是来自此代码的

grouped = data.groupby('party')
print (grouped.infants.value_counts())

我认为我应该为每个参与方创建数据框,其中包含三列y,n和?。这样。

democrat party dataframe
attr     y      n     ?
infants  156   102   9
water
....

但是如何使该过程自动化。我不想自己写所有这些信息。我也有来自此代码的这种类型的数据。

df_out = data.groupby('party')['infants'].value_counts().unstack(-1).fillna(0)


 infants    ?   n   y
 party          
 democrat   9   102 156
 republican 3   134 31

请注意,上面提到的数据框包含16列(如婴儿),输出数据框将用于进行探索性数据分析。

0 个答案:

没有答案