我有一个关于足球运动员的数据集。我想通过将俱乐部和国籍作为索引来建立层次结构。但是会发生什么:
z.set_index(['Club','Nationality'])
这是输出
它确实根据他们的俱乐部和国籍对一些球员进行分组,但不是全部。可能是什么问题?
答案 0 :(得分:0)
您可以检查docs:
我们已经“简化”了索引的较高级别,以使控制台输出看起来更容易一些。请注意,可以使用pandas.set_options()中的multi_sparse选项控制索引的显示方式:
df = pd.DataFrame({'A':list('abcaac'),
'F':list('aaabbb'),
'B':[4,5,4,5,5,4],
'C':[7,8,9,4,2,3],
}).set_index(['A','F'])
print (df)
B C
A F
a a 4 7
b a 5 8
c a 4 9
a b 5 4
b 5 2
c b 4 3
#change default value multi_sparse == True
with pd.option_context('display.multi_sparse', False):
print(df)
B C
A F
a a 4 7
b a 5 8
c a 4 9
a b 5 4
a b 5 2
c b 4 3
因此,如果要查看分组的所有级别,可以按sort_index
进行排序:
print (df.sort_index())
B C
A F
a a 4 7
b 5 4
b 5 2
b a 5 8
c a 4 9
b 4 3
#change default value multi_sparse == True
with pd.option_context('display.multi_sparse', False):
print(df.sort_index())
B C
A F
a a 4 7
a b 5 4
a b 5 2
b a 5 8
c a 4 9
c b 4 3