设置(标签,值)之间的距离

时间:2016-09-14 06:58:12

标签: python database pandas seaborn

我必须提到我是处理数据框架的初学者,我很感激任何提示:)

我有一个数据框包含文件名和大小(约8000条记录)。我试图找出可以删除或移动哪一堆文件。所以我试图绘制名字与大小的关系。

问题:

标签和(很可能是线条也重叠,即使我使用linewidth属性)

基本上,我使用的代码

>>> g = sns.barplot(y='size',x='files',data=df)
>>> for item in g.get_xticklabels():
...     item.set_rotation(45)

结果 enter image description here

samller示例中带有linewidth属性的代码

>>> g = sns.barplot(y='size',x='files',data=dfs, linewidth=2)
>>> for item in g.get_xticklabels():
...     item.set_rotation(90)

结果 enter image description here

我正在使用python3.5和OS 10.11.6

1 个答案:

答案 0 :(得分:2)

正如我在评论中所说,我不认为图表是最好的方法。我首先简化数据框以获得每个文件的平均大小:

average_size = df.groupby('files')['size'].mean()

然后,您可以使用以下内容获取前10个文件(例如)

average_size.nlargest(10, columns='size')