我正在尝试编写一个python脚本,可用于将FASTA文件重新格式化为两列,表格分隔的表格,如上图所示。该脚本应该从命令行获取输入文件的名称,结果应该转到STDOUT。
任何帮助将不胜感激!所以这就是我到目前为止:
#/user/bin/env python
import sys
import re
file_object = open(sys.argv[1])
for some_line in file_object:
if re.search('>', some_line):
sys.stdout.write(some_line.strip('\n')+ '\t')
else:
if re.search('^\w+', some_line):
sys.stdout.write(some_line.strip('w')
答案 0 :(得分:0)
您的其他内容未与相应的if语句对齐。无论如何,如果可以,我建议你摆脱重新包装。这个例子会更快:
#/user/bin/env python
import sys
file_object = open(sys.argv[1])
for some_line in file_object:
if some_line.startswith('>'):
sys.stdout.write(some_line.strip('\n') + '\t')
else:
sys.stdout.write(some_line)