在UNIX中遍历文件

时间:2013-12-16 19:40:58

标签: shell unix bioinformatics

我是UNIX的新手,所以请跟我说..我有一个长文件,看起来像这样:

0       MitoT217C       0       217

0       MitoG228A       0       228

0       MitoC295T       0       295

0       MitoC458T       0       458

此文件中没有标题。第一列代表1-22的染色体数目和X和Y染色体。我想仅为染色体编号22和X染色体提取数据并放入单独的文件中。我知道如何做后者,但我对如何获取这两条染色体的数据感到困惑。

1 个答案:

答案 0 :(得分:2)

例如:

  • GNU grep:egrep '^(22|X)' oldfile > newfile
  • GNU sed:sed -r '/^(22|X)/!d' oldfile > newfile