具有多索引的Pandas样式对象

时间:2017-01-19 09:30:07

标签: python pandas styles subset multi-index

我正在使用样式器格式化pandas数据框以突出显示列和格式数字。我还想应用多索引更清晰,愉快和易读。由于我将Styler应用于列的子集,因此无法使用多索引。

示例:

arrays = [np.hstack([['One']*2, ['Two']*2]) , ['A', 'B', 'C', 'D']]
columns = pd.MultiIndex.from_arrays(arrays)
data =  pd.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))
data.columns = columns 
import seaborn as sns
cm = sns.light_palette("green", as_cmap=True)
data.style.background_gradient(cmap=cm, subset=['A'])

有没有办法对列进行子集,以便样式器可以工作。根据以下来源,这是实现的,但没有例子,所以我很难理解如何应用它: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.formats.style.Styler.html https://github.com/pandas-dev/pandas/issues/11655

谢谢你!

4 个答案:

答案 0 :(得分:7)

我认为您可以使用pd.IndexSlice[...]方法:

data.style.background_gradient(cmap=cm, subset=pd.IndexSlice[:, pd.IndexSlice[:, 'A']])

演示:

In [5]: data.loc[pd.IndexSlice[:, pd.IndexSlice[:, 'A']]]
Out[5]:
        One
          A
0 -0.808483
1  0.009371
2  0.977138
3 -0.875554
4 -0.052424

In [6]: data
Out[6]:
        One                 Two
          A         B         C         D
0 -0.808483 -2.280683  0.576145  0.649688
1  0.009371  0.721510  1.013764 -0.157493
2  0.977138  1.441392  1.718618 -0.320826
3 -0.875554 -1.060507  1.457075  0.570195
4 -0.052424 -0.742842 -0.203830 -1.202091

在Jupyter:

enter image description here

答案 1 :(得分:1)

这是另一种方式:

data.style.background_gradient(cmap=cm, subset=data.columns.get_loc_level('A', level=1)[0])

输出:

enter image description here

答案 2 :(得分:1)

对于原始问题:

allowusers

enter image description here

您可以检查某些条件,例如子字符串:

data.style.background_gradient(cmap=cm,
                               subset=[c for c in data.columns if c[1] == 'A'])

enter image description here

或传递子列列表:

data.style.background_gradient(cmap=cm,
                               subset=[c for c in data.columns if 'T' in c[0]])

enter image description here

答案 3 :(得分:0)

如果您知道索引的层次结构是什么,例如'A'在'One'下,则可以使用元组引用该列。

data.style.background_gradient(cmap=cm, subset=[('One','A')])

然后表格将如上显示。

如果要使用多索引为多个列设置样式,则需要提供元组列表,即

arrays = [np.hstack([['One']*2, ['Two']*2]) , ['A', 'B', 'C', 'D']]
columns = pd.MultiIndex.from_arrays(arrays)
data =  pd.DataFrame(np.random.randn(5, 4), columns=list('ABCD'))
data.columns = columns 
cm = sns.light_palette("green", as_cmap=True)
data.style.background_gradient(cmap=cm, subset=[('One','A'),('Two','C')])

这样显示

Jupyter output