所以我在pandas DataFrame中存储了分层信息,我想基于这些信息构建和可视化分层树。
例如,我的DataFrame中的一行有列标题 - [ '动物门', '类', '订单', '家庭', '属', '种类', '亚种']
我希望每行创建一个树,其中所有'Subspecies'都是唯一的字符串,应该是树中的叶子。有人能指出我最好的方法/包装......这样做吗?理想情况下,输出将是matplotlib对象。提前谢谢!
答案 0 :(得分:2)
您可以使用groupby轻松地将它们放入分层索引中:
taxons = ['Phylum','Class','Order','Family','Genus','Species','Subspecies']
hierarchical_df = my_dataframe.groupby(taxons).sum() #sum or whatever is most appropiate for your data
从那里,我也试图做一个有意义的情节,显示出层次结构 (见Hierarchic pie/donut chart from Pandas DataFrame using bokeh or matplotlib?)