如果我创建一个这样的多索引列数据框:
iterables = [['bar', 'baz', 'foo', 'qux'], ['one', 'two']]
index = pd.MultiIndex.from_product(iterables, names=['first', 'second'])
df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index)
first bar baz foo qux \
second one two one two one two one
A -0.119687 -0.518318 0.113920 -1.028505 1.106375 -1.020139 -0.039300
B 0.123480 -2.091120 0.464597 -0.147211 -0.489895 -1.090659 -0.592679
C -1.174376 0.282011 -0.197658 -0.030751 0.117374 1.591109 0.796908
first
second two
A -0.938209
B -0.851483
C 0.442621
我希望使用列表
仅从第一组列中选择列 select_cols=['bar', 'qux']
结果将是:
first bar qux
second one two one two
A -0.119687 -0.518318 -0.039300 -0.938209
B 0.123480 -2.091120 -0.592679 -0.851483
C -1.174376 0.282011 0.796908 0.442621
我该怎么做呢? (提前致谢)
答案 0 :(得分:5)
简单的列选择也适用:
LinearGradientBrush
答案 1 :(得分:4)
您可以使用loc
选择列:
df.loc[:, ["bar", "qux"]]
# first bar qux
# second one two one two
# A 1.245525 -1.469999 -0.399174 0.017094
# B -0.242284 0.835131 -0.400847 -0.344612
# C -1.067006 -1.880113 -0.516234 -0.410847
答案 2 :(得分:1)
当我找到此问题时,我想我可能会看到一种打印列名的解决方案。弄清楚之后,我想我可能会增加答案。下面显示了给定级别的列名称的值。
df.columns.get_level_values(0)
=> ['bar', 'qux']
-E