Question

请检查下面的代码，我试图遍历两个数据框，并检查两个数据框的国家/地区名称是否相同。但是我一次又一次得到Na / NaN值错误，我不明白为什么？这两个数据集都没有Na / NaN值，但是尽管如此，我仍然遇到此错误。请帮忙！ IF语句引发错误。 Country_name是字符串，例如美国，印度等。

for reviewer_id, row in data.iterrows():
    for reviewer_id, row1 in data1.iterrows():
        if data1['country_name'][row1] == data['country_name'][row]:
            similar=textdistance.Levenshtein(row.Fname_Username,row1.Fname_Username)
            data2['key1']= str(data['reviewer_id'])+'_'+str(data1['reviewer_id'])
            data2['Fname_Username']= str(data['Fname_Username'])+'_'+str(data1['Fname_Username'])
            data2['Similarity1']=similar

ValueError：无法使用包含NA / NaN值的向量建立索引

Answer 1

请仔细查看iterrows()的工作方式（例如here）。row和row1已经是您要访问的行，您只需要获取其中的列，例如

if row1['country_name'] == row['country_name']:

如果条件匹配两个“ for循环”中的两个字符串

1 个答案: