比较两个文件是否重复,并将结果发送到第三个文件

时间:2018-02-23 11:07:06

标签: python duplicates

必须检查2个文件:

  1. 文件archive.txt包含已归档的用户名。
  2. 文件import.txt包含必须使用archive.txt检查的用户名。
  3. 如果导入的用户名未包含在archive.txt中,则应将其保存到第三个输出文件(new.txt)
  4. 我找到了一些有趣的代码片段,但它只比较并将新条目直接写入文件。我无法将其写入第三个文件。

    有什么想法吗?

        with open('./export/import.txt', 'r') as infile, open('./process/new.txt', 'w') as outfile:
            seen = set()
            for line in infile:
                for word in line.split():
                    if word not in seen:
                        seen.add(word)
                        outfile.write('{}\n'.format(word))
    

1 个答案:

答案 0 :(得分:3)

这应该有所帮助。

with open('./export/archive.txt', 'r') as archive, open('./export/import.txt', 'r') as importtxt, open('./export/new.txt', 'w') as outfile:
        toCheck = archive.read()
        for word in importtxt:
            if word not in toCheck:
                outfile.write('{}\n'.format(word))

这应该有所帮助。

  1. 阅读archive.txt的内容
  2. 迭代import.txt的内容并验证archive.txt中的项目
  3. 如果找不到项目,请写入new.txt