Question

有没有办法使用 pandas的横截面方法：

import numpy as np
import pandas as pd
arrays = [np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux']),
          np.array(['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two'])]
df = pd.DataFrame(np.random.randn(8, 4), index=arrays)

df.xs('bar',level=0)

与str.contains方法结合使用：https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.contains.html

目标是在特定级别选择数据，但仅基于包含给定字符串的级别。

在这种特定情况下，它会是这样的：

df.xs(df.str.contains('ba'),level=0)

在这种特定情况下，它应该返回（这是一个例子，显然在这里，做＆＃39; bar＆＃39;或者＆＃39; ba＆＃39;会返回相同的输出）

         0         1         2         3
one -0.148672  1.025935  0.948375 -0.214719
two  0.066008  0.429827  0.621165 -0.534449

Answer 1

boolean indexing使用get_level_values：

df = df[df.index.get_level_values(0).str.contains('ba')]
print (df)
                0         1         2         3
bar one -0.556376 -0.295627  0.618673 -0.409434
    two  0.107020 -1.143460 -0.145909  0.017417
baz one  0.117667 -0.301128  0.880918 -1.027282
    two  2.287448  1.528137 -1.528636  0.052728

详细说明：

print (df.index.get_level_values(0))
Index(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], dtype='object')

print (df.index.get_level_values(0).str.contains('ba'))
[ True  True  True  True False False False False]

Python - Pandas - 结合str.contains使用横截面

1 个答案: