应用错误收集

我有三个不同的csv文件。这三个都有相同的列和列名称。但是行值不同。每个csv都有一个称为用户ID的列。我需要计算一下，第二个csv文件中不存在多少个第一csv文件中的用户。同样，我必须在第一与第二，第二与第三，第一与第三之间进行比较。那怎么办呢？

我尝试使用

import csv  
import pandas as pd

file1 =  '25th Feb.csv'  
file2 =  '4th March.csv'

with open(file1) as fp1:  
root = csv.reader(fp1)  
rows1 = {}  
for i in root:  
    rows1[i[0]]=i  
if "User Id" in rows1:  
    del rows1["User Id"]  

with open(file2) as fp1:  
root = csv.reader(fp1)  
rows2 = {}  
for i in root:  
    rows2[i[0]]=i  
if "User Id" in rows2:  
    del rows2["User Id"]  

result = set(rows1.keys()).intersection(set(rows2.keys()))

print (list(result))

我只得到这样的
[]

在两个不同的csv文件中检查相同的列值

0 个答案: