我有三个不同的csv文件。这三个都有相同的列和列名称。但是行值不同。每个csv都有一个称为用户ID的列。我需要计算一下,第二个csv文件中不存在多少个第一csv文件中的用户。同样,我必须在第一与第二,第二与第三,第一与第三之间进行比较。那怎么办呢?
我尝试使用
import csv
import pandas as pd
file1 = '25th Feb.csv'
file2 = '4th March.csv'
with open(file1) as fp1:
root = csv.reader(fp1)
rows1 = {}
for i in root:
rows1[i[0]]=i
if "User Id" in rows1:
del rows1["User Id"]
with open(file2) as fp1:
root = csv.reader(fp1)
rows2 = {}
for i in root:
rows2[i[0]]=i
if "User Id" in rows2:
del rows2["User Id"]
result = set(rows1.keys()).intersection(set(rows2.keys()))
print (list(result))
我只得到这样的
[]