使用Python比较两个csv文件并在两个文件中查找类似值,并将相似值保存在另一个文件中作为匹配值

时间:2017-01-08 15:01:39

标签: python python-2.7

我想在两个csv文件中找到类似的记录。一个csv文件中有9列,而第二个也可能有相同的列。该表格可以在

查看

1)DHU_Table

2)HDU_Table

但只有少数几列相关。喜欢

Results---Judge Status,
When----Submit Time,
Language-----Language,
Time----Exe.Time,

如何仅使用这些特定列进行比较?

1 个答案:

答案 0 :(得分:0)

这里的a link可能有所帮助。一旦你弄清楚如何读取CSV文件(或自己解析数据),你就可以创建一个包含CSV文件行中所有信息的类。例如,如果您将AGE和NAME作为两列,则可以创建包含年龄和名称的类。

class Row:
    def __init__ (self, AGE, NAME):
        self.name = NAME
        self.age = AGE

一旦从两个文件中收集了所有信息(例如将类存储在列表中),您就可以编写一个算法来比较类并找到相似之处,例如:

def compareName (row1, row2):
    return (row1.name == row2.name)