Pandas数据框列在绘图时排序

时间:2017-06-15 01:31:00

标签: python pandas matplotlib histogram

我有一个包含多个列的pandas数据框,如下所示:

columns_all = pd.DataFrame({'m1_h':m1_hist, 'm2_h':m2_hist, ....... 'm6_h':m6_hist, 'm6_f':m6_futu})

并且我使用以下来绘制基于每列的直方图但是列已经排序但我喜欢让所有直方图与上面数据帧中写入的列的顺序相同:

columns_all.hist(layout=(2,6), sharey=True, sharex=True)
plt.ylim(0, 100)
plt.xlim(0, 150)
plt.show()

在绘图时欣赏任何维持列顺序的建议。

2 个答案:

答案 0 :(得分:1)

您可以重复调用各个列,因为在创建数据帧和.hist()时都会自动重新排序:

s = pd.DataFrame([{'B': 1.5, 'A':3, 'C': 4, 'D':2}])
s

    A   B   C   D
0   3   1.5 4   2

s = s[["B", "A", "C", "D"]] #chose your order
s

    B   A   C   D
0   1.5 3   4   2

for x in s.columns:
    s[[x]].hist(layout=(2,6), sharey=True, sharex=True)
plt.ylim(0, 100)
plt.xlim(0, 150)
plt.show()

答案 1 :(得分:1)

根据the source code,排序由_try_sort(data.columns)定义,不能通过参数更改。你可以做Claudiu Creanga suggested。但是,在我的测试中,它不会给你(2, 6)布局。如果您真的想要这个布局以及pandas.DataFrame.hist做什么,以下代码可能会有所帮助:

from matplotlib import pyplot as plt
import numpy as np
import pandas as pd

columns_all = pd.DataFrame([np.random.randn(1000)] * 7).T
columns_all.columns = ['m1_h', 'm2_h', 'm3_h', 'm4_h', 'm5_h', 'm6_h', 'm6_f']
plt.clf()
fig = plt.figure(figsize=(16, 4))
axarr = []
for i, col in enumerate(columns_all.columns):
    if i // 6 > 0:
        sharex = axarr[i % 6]
        plt.setp(axarr[i % 6].get_xticklabels(), visible=False)
    else:
        sharex = None
    if i % 6 > 0:
        sharey = axarr[i // 6]
    else:
        sharey = None
    ax = fig.add_subplot(2, 6, i + 1, sharex=sharex, sharey=sharey)
    axarr.append(ax)
    if i % 6 > 0:
        plt.setp(ax.get_yticklabels(), visible=False)
    ax.hist(columns_all[col].dropna().values)
    ax.set_title(col)
    ax.grid(True)
fig.subplots_adjust(wspace=0.3, hspace=0.3)
plt.show()

enter image description here