awk跳过包括模式

时间:2017-06-14 15:36:06

标签: awk

我正在尝试使用awk跳过所有行,包括特定模式/^#CHROM/,并在下面的行开始处理。 awk确实会执行,但目前会返回tab-delimited file中的所有行。谢谢你:)。

文件

##INFO=<ID=ANN,Number=1,Type=Integer,Description="My custom annotation">
##source_20170530.1=vcf-annotate(r953) -d key=INFO,ID=ANN,Number=1,Type=Integer,Description=My custom annotation -c CHROM,FROM,TO,INFO/ANN
##INFO=<ID=,Number=A,Type=Float,Description="Variant quality">
#CHROM  POS ID  REF ALT
chr1    948846  .   T   TA  NA  NA
chr2    948852  .   T   TA  NA  NA
chr3    948888  .   T   TA  NA  NA

AWK

awk -F'\t' -v OFS="\t" 'NR>/^#CHROM/ {print $1,$2,$3,$4,$5,"ID=1"$6,"ID=2"$7}' file

desiered output

chr1    948846  .   T   TA  ID1=NA  ID2=NA
chr2    948852  .   T   TA  ID1=NA  ID2=NA
chr3    948888  .   T   TA  ID1=NA  ID2=NA

2 个答案:

答案 0 :(得分:2)

使用以下 awk 方法:

awk -v OFS="\t" '/^#CHROM/{ r=NR }r && NR>r{ $6="ID=1"$6; $7="ID=2"$7; print }' file

输出:

chr1    948846  .   T   TA  ID=1NA  ID=2NA
chr2    948852  .   T   TA  ID=1NA  ID=2NA
chr3    948888  .   T   TA  ID=1NA  ID=2NA
  • /^#CHROM/{ r=NR } - 捕获模式行号

替代方法如下所示:

awk -v OFS="\t" '/^#CHROM/{ f=1; next }f{ $6="ID=1"$6; $7="ID=2"$7; print }' file

答案 1 :(得分:2)

awk 'BEGIN{FS=OFS="\t"} f{print $1,$2,$3,$4,$5,"ID1="$6,"ID2="$7} /^#CHROM/{f=1}' file

有关此问题和其他awk搜索习惯用法的详细信息,请参阅https://stackoverflow.com/a/17914105/1745001。你的是&#34; b&#34;的变体。在那个页面上。