我想在第三栏中用'6-1'开头的东西。所以应该抓住类似'6-1 * blahblah'的东西,我希望输出整条线。我想知道这是什么正确的语法?
一行样本输入包括:
hg19_gold_AL122127.6-109525 0 1-18*anc 1 18 65S185M * 0 0 GAGAAACCAGGCCAGTCATGTGAGACTTCACCCACTCCTGTGTCCTCTCCACAGGTGCCCACTCCCAGGTTCAGCTGGTGCAGTCTGGAGCTGAGGTGAAGAAGCCTGGGGCCTCAGTGAAGGTCTCCTGCAAGGCTTCTGGTTACACCTTTACCAGCTATGGTATCAGCTGGGTGCGACAGGCCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAGCGCTTACAATGGTAACACAAACTATGCACA ?????@<BBDB@EDDDFGCG+FIFHIHHHFD>HIHII>AHHIIF5IHHHGIHDFEFHHGHHHHHIIFIDIGBAHIBHDH=BHIHG;IHHHFHF+HIHIIHDHGFI=H=H=FGG?FH7HHCHGGHGHHGDHFADEGFG2GFD@GGGGGBGCGEEGF*EGAGGFCFEFFGGFC0E;GCGEGCEFEFAEEGEE0EEGGECGGAGFEEEG?GCEHHHHF*ECF?G<FGEGFGAGGEEEEAGA8GE?GGEC?EGF AS:i:37
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
但输出应该只是第二行
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
答案 0 :(得分:0)
如果您使用awk
,则可以执行以下操作:
awk '$3~/^6-1/' file
hg38_gold_AC246787.2-87811 16 6-1*anc 259 2 47M203S * AACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGACACAGTGAGGGGAAGTCAGTGTGAGCCCAGACACAAACCTCCCTGCAGGGATGCTCAGGACCCCAGAAGGCACCCAGCACTACCAGCGCAGGGCCCAGACCAGGAGCAGGTGTGGAGTTAAGCAAAAATGGAACTTCTTGCTGTGTCTTAAACTGTTGTTGTTTTTTTTTTTTTTTTGGCTCAGCAACAGAGATCATAGAAAA CGFEGEG:C:G4E;CGEE*CC?G:?GG?GGECFCHFAECF:FAFEG*GGE6?0GCGE;GGEFFCEG:GGG/ECGG+GGF?2GEGGEGDGEEEEEF/EECGGGGGEGGGFGGGGGEGDGEHGEFGF5EG=GGFEHGDFHFHEEIHGGFHHFGGIHGHHHHHI-IHIHHIIEFICIIAHGHFHHIHIDGFCHHIHEHHIIFIDIHIHHGHFIIGIHFIFIEHHIFIIHHIFFGFFFDDE?DDDEBBB????? AS:i:94 XS:i:68 XN:i:0 XM:i:0 XO:i:0 XG:i:0 NM:i:0 MD:Z:47 YT:Z:UU
只会获得第三个字段以6-1