如何为包含特定项目的列表筛选DataFrame列

时间:2015-08-28 22:17:52

标签: python python-2.7 pandas

如果我想为包含特定术语的字符串过滤一列字符串,我可以这样做:

df = pd.DataFrame({'col':['ab','ac','abc']})
df[df['col'].str.contains('b')]

返回:

   col
0   ab
2  abc

如何为包含特定项目的列表筛选列表?例如,来自

df = pd.DataFrame({'col':[['a','b'],['a','c'],['a','b','c']]})

如何获取包含' b'?

的所有列表
         col
0     [a, b]
2  [a, b, c]

1 个答案:

答案 0 :(得分:9)

您可以像这样使用申请。

In [13]: df[df['col'].apply(lambda x: 'b' in x)]
Out[13]: 
         col
0     [a, b]
2  [a, b, c]

虽然通常情况下,将列表存储在DataFrame中有点尴尬 - 您可能会发现一些更容易使用的表示(列表中的每个元素的列,MultiIndex等)。