有没有办法使用 pandas的横截面方法:
import numpy as np
import pandas as pd
arrays = [np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux']),
np.array(['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two'])]
df = pd.DataFrame(np.random.randn(8, 4), index=arrays)
df.xs('bar',level=0)
与str.contains方法结合使用:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.contains.html
目标是在特定级别选择数据,但仅基于包含给定字符串的级别。
在这种特定情况下,它会是这样的:
df.xs(df.str.contains('ba'),level=0)
在这种特定情况下,它应该返回(这是一个例子,显然在这里,做' bar'或者' ba'会返回相同的输出)
0 1 2 3
one -0.148672 1.025935 0.948375 -0.214719
two 0.066008 0.429827 0.621165 -0.534449
答案 0 :(得分:1)
boolean indexing
使用get_level_values
:
df = df[df.index.get_level_values(0).str.contains('ba')]
print (df)
0 1 2 3
bar one -0.556376 -0.295627 0.618673 -0.409434
two 0.107020 -1.143460 -0.145909 0.017417
baz one 0.117667 -0.301128 0.880918 -1.027282
two 2.287448 1.528137 -1.528636 0.052728
详细说明:
print (df.index.get_level_values(0))
Index(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], dtype='object')
print (df.index.get_level_values(0).str.contains('ba'))
[ True True True True False False False False]