使用pandas在Python中创建和绘制分层树

时间:2014-10-01 15:33:53

标签: python matplotlib pandas tree hierarchical-clustering

所以我在pandas DataFrame中存储了分层信息,我想基于这些信息构建和可视化分层树。

例如,我的DataFrame中的一行有列标题 - [ '动物门', '类', '订单', '家庭', '属', '种类', '亚种']

我希望每行创建一个树,其中所有'Subspecies'都是唯一的字符串,应该是树中的叶子。有人能指出我最好的方法/包装......这样做吗?理想情况下,输出将是matplotlib对象。提前谢谢!

1 个答案:

答案 0 :(得分:2)

您可以使用groupby轻松地将它们放入分层索引中:

taxons = ['Phylum','Class','Order','Family','Genus','Species','Subspecies']
hierarchical_df = my_dataframe.groupby(taxons).sum() #sum or whatever is most appropiate for your data

从那里,我也试图做一个有意义的情节,显示出层次结构 (见Hierarchic pie/donut chart from Pandas DataFrame using bokeh or matplotlib?