我必须提到我是处理数据框架的初学者,我很感激任何提示:)
我有一个数据框包含文件名和大小(约8000条记录)。我试图找出可以删除或移动哪一堆文件。所以我试图绘制名字与大小的关系。
问题:
标签和(很可能是线条也重叠,即使我使用linewidth
属性)
>>> g = sns.barplot(y='size',x='files',data=df)
>>> for item in g.get_xticklabels():
... item.set_rotation(45)
samller示例中带有linewidth
属性的代码
>>> g = sns.barplot(y='size',x='files',data=dfs, linewidth=2)
>>> for item in g.get_xticklabels():
... item.set_rotation(90)
我正在使用python3.5和OS 10.11.6
答案 0 :(得分:2)
正如我在评论中所说,我不认为图表是最好的方法。我首先简化数据框以获得每个文件的平均大小:
average_size = df.groupby('files')['size'].mean()
然后,您可以使用以下内容获取前10个文件(例如)
average_size.nlargest(10, columns='size')