请检查下面的代码,我试图遍历两个数据框,并检查两个数据框的国家/地区名称是否相同。但是我一次又一次得到Na / NaN值错误,我不明白为什么?这两个数据集都没有Na / NaN值,但是尽管如此,我仍然遇到此错误。请帮忙! IF语句引发错误。 Country_name是字符串,例如美国,印度等。
for reviewer_id, row in data.iterrows():
for reviewer_id, row1 in data1.iterrows():
if data1['country_name'][row1] == data['country_name'][row]:
similar=textdistance.Levenshtein(row.Fname_Username,row1.Fname_Username)
data2['key1']= str(data['reviewer_id'])+'_'+str(data1['reviewer_id'])
data2['Fname_Username']= str(data['Fname_Username'])+'_'+str(data1['Fname_Username'])
data2['Similarity1']=similar
ValueError:无法使用包含NA / NaN值的向量建立索引
答案 0 :(得分:1)
请仔细查看iterrows()
的工作方式(例如here)。row
和row1
已经是您要访问的行,您只需要获取其中的列,例如
if row1['country_name'] == row['country_name']: