bash - 基于特定列的两个文件的交集?

时间:2011-06-20 06:46:24

标签: bash file intersection

我想做以下事情,如果有人能帮助我做到这一点,我将非常感激:

我有两个名为File1.txt和File2.txt的制表符分隔文件(如下所示)。 如果File2.txt中的第二列(整数)在File2.txt的第3列(整数)中找到则 我想制作new_File1.txt和new_File2.txt并继续追加 行。

FILE1.TXT:

1   80  xyc
1   304 xyv
1   813653  xyb
1   813661  xyn
1   954653  xym

FILE2.TXT:

abvb    1   178
aaa 1   304 
ttt 1   353
ggg 1   98971
ghj 1   813653

例如,我的new_File1.txt将如下所示:

new_File1.txt:

1   304 xyv
1   813653  xyb

new_File2.txt:

aaa     1   304
ghj     1   813653

谢谢大家的帮助! 我用过:

join -1 2 -2 3 -t '\t' file1.txt file2.txt

但它给了我以下输出:

\1      80      xyc\abvb        1       178
\1      80      xyc\aaa 1       304
\1      80      xyc\ttt 1       353
\1      80      xyc\ggg 1       98971
\1      80      xyc\ghj 1       813653
\1      304     xyv\abvb        1       178
\1      304     xyv\aaa 1       304
\1      304     xyv\ttt 1       353
\1      304     xyv\ggg 1       98971
\1      304     xyv\ghj 1       813653
\1      813653  xyb\abvb        1       178
\1      813653  xyb\aaa 1       304
\1      813653  xyb\ttt 1       353
\1      813653  xyb\ggg 1       98971
\1      813653  xyb\ghj 1       813653
\1      813661  xyn\abvb        1       178
\1      813661  xyn\aaa 1       304
\1      813661  xyn\ttt 1       353
\1      813661  xyn\ggg 1       98971
\1      813661  xyn\ghj 1       813653
\1      954653  xym\abvb        1       178
\1      954653  xym\aaa 1       304
\1      954653  xym\ttt 1       353
\1      954653  xym\ggg 1       98971
\1      954653  xym\ghj 1       813653

1 个答案:

答案 0 :(得分:5)

您正在寻找join(1)