我有几个文件格式如下:
TCTCTGGAAAGGGACGCCTGGGAGG 10 AAAAATACATTCTAACCTCGGCGT 1 TAATTTCATCAATATATCAATG 1 (etc...)
我想删除空格后的所有内容,以便我最终得到这个:
TCTCTGGAAAGGGACGCCTGGGAGG AAAAATACATTCTAACCTCGGCGT TAATTTCATCAATATATCAATG (etc...)
我该怎么做?
答案 0 :(得分:2)
您可以使用awk执行此操作:
cat oldfile | awk '{print $1}' > newfile
答案 1 :(得分:2)
cut -d' ' -f1 file.txt
或:
sed 's/ .*//' file.txt
或
sed -e 's/[^ACTG]//g' file.txt
或
awk '{print $1}' file.txt
答案 2 :(得分:0)
不像timos的答案那样简洁和漂亮:),但是另一个相同功能的快速示例,但是用Ruby编写。
#!/usr/bin/env ruby
data = File.read("data.txt")
f = File.open("outData.txt", "w")
finalData = data.scan(/^\w+/)
finalData.each {|i| f.write(i + "\n")}
f.close