使用str.contains

时间:2019-11-29 17:52:13

标签: python pandas

我正在尝试使用为数据集修改的解决方案在两个数据集之间进行部分字符串匹配的merge / vlookup

def partial(x):
    return new_file.loc[new_file['name'].str.contains(x),'global_id'].iloc[0]
df2['new'] = df2['name'].apply(partial)

想法是在名称包含类似于df2中的字符串的情况下从新文件获取全局ID。

这是df2外观的一个示例

name 
Joe George Harris
Freddy *$&# Luis *&# Francis

和新文件:

name              global_id
Joe Harris               2
Freedy Francis          50

这些不是我的数据集的精确副本,但是有点像我的数据(只是更多的数据)

运行我的代码将返回以下错误消息:

IndexError: single positional indexer is out-of-bounds

我假设我可能会收到此错误,因为newfile ['name']中的某些值在第一个数据帧中不存在,但是如果这是问题所在,则不确定如何解决此问题

0 个答案:

没有答案