我有两个文件,文件1看起来像:
rs12126768 T 0.0252778071842686
rs908742 A -0.0175531592475892
rs3107147 A 0.0253753063312283
rs3128309 A 0.0284902703996274
rs16824948 T 0.0696193418800571
rs2643888 A 0.0452601314048646
rs3795272 T -0.0244976316004002
rs2840531 T -0.0438473997802763
rs10910060 A 0.0364283566135514
rs1129332 T -0.0274739770007551
文件2看起来像:
1 rs908742 0 2033256
1 rs3795272 0 2284195
1 rs2840531 0 2286408
1 rs1129332 0 2336210
1 rs7512269 0 2418625
1 rs2247308 0 2445406
1 rs1980789 0 2455863
1 rs3122922 0 2456203
1 rs4648453 0 3025712
1 rs6424069 0 3147030
如果文件1中的$ 1出现在文件2的$ 2中,我希望它打印该行。所以期望的输出是:
rs908742 A -0.0175531592475892
rs3795272 T -0.0244976316004002
rs2840531 T -0.0438473997802763
rs1129332 T -0.0274739770007551
提前感谢您的帮助。
答案 0 :(得分:7)
试试这个单行:
awk 'NR==FNR{a[$2];next}$1 in a' file2 file1
答案 1 :(得分:0)
我建议这样做的算法是简单散列。读取文件2,并记住file2的$ 2中的所有内容。然后,通读file1,如果file1中的$ 1在内存中,则打印该行。
这是一个执行技巧的perl脚本:
use strict;
open FILE2, "file2.txt";
my %remember;
while(<FILE2>) {
chomp $_;
my @fields = split;
$remember{$fields[1]} = 1;
}
open FILE1, "file1.txt";
while(<FILE1>) {
chomp $_;
my @fields = split;
if(defined $remember{$fields[0]}) {
print "$_\n";
}
}