我有一个DataFrame
,如下所示:
import numpy as np
import pandas as pd
import string
import random
random.seed(42)
df = pd.DataFrame({'col1': list(string.ascii_lowercase)[:11],
'col2':[random.randint(1,100) for x in range(11)]})
df
col1 col2
0 a 64
1 b 3
2 c 28
3 d 23
4 e 74
5 f 68
6 g 90
7 h 9
8 i 43
9 j 3
10 k 22
我正在尝试基于过滤与值列表匹配的前一个数据框的行来创建一个新的数据框。我已经尝试了下一段代码:
df_filt = df[df['col1'] in ['a','c','h']]
但是我得到一个错误。我期待下一个结果:
df_filt
col1 col2
0 a 64
1 c 28
2 h 9
我正在寻找一种灵活的解决方案,该解决方案允许基于匹配列表中比示例中所显示的元素更多的元素进行过滤。
答案 0 :(得分:1)
您可以使用pandas.Series.isin
进行复合“中”检查。
输入数据框:
>>> df
>>>
col1 col2
0 a 64
1 b 3
2 c 28
3 d 23
4 e 74
5 f 68
6 g 90
7 h 9
8 i 43
9 j 3
10 k 22
输出数据框:
>>> df[df['col1'].isin(['a', 'c', 'h'])]
>>>
col1 col2
0 a 64
2 c 28
7 h 9
答案 1 :(得分:1)
使用isin
df_filt = df[df.col1.isin(['a','c','h'])]