有没有一种方法可以将列表与其他匹配?

时间:2021-04-05 13:07:01

标签: python-3.x pandas nlp text-classification

我有一个像这样的数据框:

  target   ;  terms
  Sport    ;  Football,Handball, Tennis
  Mécanique ;  voiture, moto, tracteur, bus
  Technologies;  ordinateur, téléphone,tablette, radio, écouteur

在我输入的程序中:

list_terms=  ['Football','Handball','ordinateur','tablette','Tennis']

预期输出:

targets : Sport,Technologies 

1 个答案:

答案 0 :(得分:0)

您可以在行上使用 apply() 并检查 terms 列在条目列表中是否有任何值。

def check(row):
    targets = [term for term in row['terms'].split(',') if term in entry_list]

    if len(targets) > 0:
        return row['target'] + ' ({:.2f})'.format(len(targets)/len(entry_list))
    else:
        return np.nan

print(df.apply(check, axis=1).dropna().tolist())

"""
['Sport (0.50)', 'Technologies (0.33)']
"""

如果你不想要目标后的概率,你可以使用

def check(row):
    targets = [term for term in row['terms'].split(',') if term in entry_list]
    return len(targets) > 0

print(df[df.apply(check, axis=1)]['target'].tolist())

"""
['Sport', 'Technologies']
"""