终端编辑文件删除某些字符

时间:2012-06-24 19:14:43

标签: terminal

我有几个文件格式如下:

TCTCTGGAAAGGGACGCCTGGGAGG   10
AAAAATACATTCTAACCTCGGCGT    1
TAATTTCATCAATATATCAATG  1
(etc...)

我想删除空格后的所有内容,以便我最终得到这个:

TCTCTGGAAAGGGACGCCTGGGAGG
AAAAATACATTCTAACCTCGGCGT
TAATTTCATCAATATATCAATG
(etc...)

我该怎么做?

3 个答案:

答案 0 :(得分:2)

您可以使用awk执行此操作:

cat oldfile | awk '{print $1}' > newfile

答案 1 :(得分:2)

cut -d' ' -f1 file.txt

或:

sed 's/ .*//' file.txt

sed -e 's/[^ACTG]//g' file.txt

awk '{print $1}' file.txt

答案 2 :(得分:0)

不像timos的答案那样简洁和漂亮:),但是另一个相同功能的快速示例,但是用Ruby编写。

#!/usr/bin/env ruby

data = File.read("data.txt")
f = File.open("outData.txt", "w")
finalData = data.scan(/^\w+/)
finalData.each {|i| f.write(i + "\n")}
f.close