使用awk解析特定条件

时间:2015-03-14 17:13:01

标签: awk

我正在尝试使用awk来解析多个条件并在第一个条件上遇到一些问题。我认为下面的代码很接近,但它没有返回所需的输出。解析规则是:谢谢:)。

  1. NC_之后的4个零(并非总是如此)和。之前的数字。
  2. 克。 ### g。###
  3. c
  4. awk -F" [_。>]" ' FNR> 1 {X = $ 4 + 0; sub(X,"",$ 4);打印$ 2 + 0,X,X,$ 4,$ 5}' OFS =" \吨" $ {id} _position.txt> $ {ID} _parse.txt

  5. id_position.txt

    Input Variant   Errors  Chromosomal Variant Coding Variant(s)
    NM_004004.5:c.79G>A     NC_000013.10:g.20763642C>T  NM_004004.5:c.79G>A XM_005266354.1:c.79G>A  XM_005266355.1:c.79G>A  XM_005266356.1:c.79G>A
    

    期望的输出:

    13     20763642     20763642     C     T
    

1 个答案:

答案 0 :(得分:0)

这应该做:

awk 'NR==2 {split($2,a,"[_.>]");b=substr(a[4],1,length(a[4]-1));print a[2]+0,b,b,substr(a[4],length(a[4])),a[5]}' OFS="\t" file
13      20763642        20763642        C       T