在两个不同的csv文件中检查相同的列值

时间:2019-03-06 11:17:01

标签: python data-analysis

我有三个不同的csv文件。这三个都有相同的列和列名称。但是行值不同。每个csv都有一个称为用户ID的列。我需要计算一下,第二个csv文件中不存在多少个第一csv文件中的用户。同样,我必须在第一与第二,第二与第三,第一与第三之间进行比较。那怎么办呢?

我尝试使用

import csv  
import pandas as pd

file1 =  '25th Feb.csv'  
file2 =  '4th March.csv'

with open(file1) as fp1:  
root = csv.reader(fp1)  
rows1 = {}  
for i in root:  
    rows1[i[0]]=i  
if "User Id" in rows1:  
    del rows1["User Id"]  

with open(file2) as fp1:  
root = csv.reader(fp1)  
rows2 = {}  
for i in root:  
    rows2[i[0]]=i  
if "User Id" in rows2:  
    del rows2["User Id"]  

result = set(rows1.keys()).intersection(set(rows2.keys()))

print (list(result))  

我只得到这样的
[]

0 个答案:

没有答案