我正在尝试使用为数据集修改的解决方案在两个数据集之间进行部分字符串匹配的merge / vlookup
def partial(x):
return new_file.loc[new_file['name'].str.contains(x),'global_id'].iloc[0]
df2['new'] = df2['name'].apply(partial)
想法是在名称包含类似于df2中的字符串的情况下从新文件获取全局ID。
这是df2外观的一个示例
name
Joe George Harris
Freddy *$&# Luis *&# Francis
和新文件:
name global_id
Joe Harris 2
Freedy Francis 50
这些不是我的数据集的精确副本,但是有点像我的数据(只是更多的数据)
运行我的代码将返回以下错误消息:
IndexError: single positional indexer is out-of-bounds
我假设我可能会收到此错误,因为newfile ['name']中的某些值在第一个数据帧中不存在,但是如果这是问题所在,则不确定如何解决此问题