我的基因型文件包含> 950,000行,如下所示:
24 rs2641123 0 59027434
24 rs4893711 0 59027575
24 rs4047329 0 59027910
24 rs28698289 0 59028502
24 rs2334088 0 59029364
24 rs6568298 0 59029728
24 rs4047343 0 59030922
其中第二列包含每行的唯一代码。
我想根据列表过滤基因型文件,该列表仅包含要排除的唯一代码的名称。该列表如下所示:
rs2641123
rs4893711
rs28698289
rs2334088
原则上,两个文件中的代码都以相同的方式排序。
我想过使用grep
,但我不确定如何实现它。
谢谢!