从文本文件中删除字符串

时间:2014-01-20 11:39:20

标签: sed awk grep

我的文件包含核苷酸的文本字符串(ACGT)。我想从文本文件中找到特定字符串并删除它们。

例如:

ACTGGGCTGTCCAACTG     
ACTTCTGGGTCGAACTG     
CCCACTTCTGGGTTCAA

我想从所有行中删除此部分ACTGGG 然后我将使用此字符串获取文件:

CTGTCCAACTG    
TCTTCGAACTG    
CCCTCTTTCAA

4 个答案:

答案 0 :(得分:2)

可以帮助您:

sed 's/ACT//g; s/GGG//g' inputFile

即。用空字符串替换所有出现的ACTGGG

答案 1 :(得分:1)

您可以尝试:

awk '{gsub(/ACT|GGG/,"")}1' file

答案 2 :(得分:1)

使用sed

sed -r 's/(ACT|GGG)//g' file

答案 3 :(得分:0)

perl -pe 's/ACT|GGG//g' your_file