Pandas:查看项目是否在数据框中的Series.series列表中

时间:2015-10-07 04:45:59

标签: python pandas dataframe series

我的数据框看起来像这样(小版本):

    A   B   C
0   125 ADB [AF:12]
1   189 ACB [AF:78, AF:85, AF:98]
2   148 ADB []
3   789 ARF [AF:89, AF:85, AF:12]
4   789 BCD [AF:76, AF:25]

如何查看列“C”中的某些项目是否在列表中? 知道当我输入(df.C)时,我得到class 'pandas.core.series.Series'

例如,如果列表是:

['AF:12', 'AF25']

预期输出为:

    A   B   C                        D
0   125 ADB [AF:12]                  True
1   189 ACB [AF:78, AF:85, AF:98]    False
2   148 ADB []                       False
3   789 ARF [AF:89, AF:85, AF:12]    True
4   789 BCD [AF:76, AF:25]           True

我试过df['D'] = df['C'].isin(list) 但到处都是假,因为“C”是列表清单。

有没有办法解决这个问题?

非常感谢任何帮助

3 个答案:

答案 0 :(得分:4)

如果C列的元素类型为list,那么我相信一种方法是在列表与{{1}的元素之间使用set交集使用Series.apply方法的列。示例 -

C

如果setlst = set(yourlist) df['D'] = df['C'].apply(lambda x: bool(setlst.intersection(x))) C,您可以确认type(df['C'][0])属于类型列表。

另请注意,建议不要使用列表作为变量名称,因为它会影响内置类型list

答案 1 :(得分:1)

data = {'B':['ADB','ACB','ADB','ARF','BCD'],
        'A':[125,189,148,789,789],
        'C':[['AF:12'],['AF:78', 'AF:85', 'AF:98'],[],
        ['AF:89', 'AF:85', 'AF:12'],['AF:76', 'AF:25']]}

df = pd.DataFrame(data)

def in_list(list_to_search,terms_to_search):
    results = [item for item in list_to_search if item in terms_to_search]
    if len(results) > 0:
        return 'True'
    else:
        return 'False'

df['D'] = df['C'].apply(lambda x: in_list(x, ['AF:12', 'AF:25']))

结果:

     A    B                      C      D
0  125  ADB                [AF:12]   True
1  189  ACB  [AF:78, AF:85, AF:98]  False
2  148  ADB                     []  False
3  789  ARF  [AF:89, AF:85, AF:12]   True
4  789  BCD         [AF:76, AF:25]   True

答案 2 :(得分:0)

def is_in_list():
    for ele in df['C']:
    if ele in list:
        return True
    return False;

也许这个功能可以做到。