我正在尝试使用awk
来解析多个条件并在第一个条件上遇到一些问题。我认为下面的代码很接近,但它没有返回所需的输出。解析规则是:谢谢:)。
吨
awk -F" [_。>]" ' FNR> 1 {X = $ 4 + 0; sub(X,"",$ 4);打印$ 2 + 0,X,X,$ 4,$ 5}' OFS =" \吨" $ {id} _position.txt> $ {ID} _parse.txt
id_position.txt
Input Variant Errors Chromosomal Variant Coding Variant(s)
NM_004004.5:c.79G>A NC_000013.10:g.20763642C>T NM_004004.5:c.79G>A XM_005266354.1:c.79G>A XM_005266355.1:c.79G>A XM_005266356.1:c.79G>A
期望的输出:
13 20763642 20763642 C T
答案 0 :(得分:0)
这应该做:
awk 'NR==2 {split($2,a,"[_.>]");b=substr(a[4],1,length(a[4]-1));print a[2]+0,b,b,substr(a[4],length(a[4])),a[5]}' OFS="\t" file
13 20763642 20763642 C T