我有这样的数据。我想创建此数据的图形以使用python执行EDA。如何存储这些数据,以便我可以轻松执行EDA?
party infants
democrat y 156
n 102
? 9
republican n 134
y 31
? 3
这是来自此代码的
grouped = data.groupby('party')
print (grouped.infants.value_counts())
我认为我应该为每个参与方创建数据框,其中包含三列y,n和?。这样。
democrat party dataframe
attr y n ?
infants 156 102 9
water
....
但是如何使该过程自动化。我不想自己写所有这些信息。我也有来自此代码的这种类型的数据。
df_out = data.groupby('party')['infants'].value_counts().unstack(-1).fillna(0)
infants ? n y
party
democrat 9 102 156
republican 3 134 31
请注意,上面提到的数据框包含16列(如婴儿),输出数据框将用于进行探索性数据分析。