如何找到两个非常大的文件的重叠行

时间:2018-02-19 01:27:45

标签: python-3.x

我有两个非常大的制表符分隔文件(> 10G)。两个文件中都存在一些具有相同第一和第二字段的行。如何在具有重叠的第一和第二个字段的两个文件中找到这些行?

第一个文件

3 mmm gcd 1467

A 4 ghd u7 14io

A 5 230 op 892

A 7 36u ojk 568

................

................

第二个文件

1 m5t hf 1456

3 vcv uyn 90p

4 nm io 09y

6 78 ml po

8 kl pli,ll

................

................

然后我想得到第一个文件中的第一行和第二行,以及第二个文件中的第二行和第三行。

谢谢你的时间!

0 个答案:

没有答案