如何从fasta文件中删除第一行?

时间:2014-12-20 11:17:09

标签: python string python-2.7 fasta

fasta文件的结构如下:

>gi|568815364|ref|NT_077402.3| Homo sapiens chromosome 1 genomic scaffold, GRCh38 Primary Assembly HSCHR1_CTG1
TAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAAC
CCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCAACCCTAACCCTAACCCTAACCCTAACCCTAA
CCCTAACCCCTAACCCTAACCCTAACCCTAACCCTAACCTAACCCTAACCCTAACCCTAACCCTAACCCT
AACCCTAACCCTAACCCTAACCCCTAACCCTAACCCTAAACCCTAAACCCTAACCCTAACCCTAACCCTA
ACCCTAACCCCAACCCCAACCCCAACCCCAACCCCAACCCCAACCCTAACCCCTAACCCTAACCCTAACC

第一行是关于文件内容的一些信息,其余行是DNA,RNA或氨基酸的链。 要对这种文件做一些工作,我需要删除第一行文件。我怎么能用python做到这一点? 我试过这段代码,但不适合:

My_string=open("SimpleFastaFile.fa", "r").read()
def line_remove(str):
    if str.isalnum()==False:
        str=str[1:]
        line_remove(str)

line_remove(My_string)

2 个答案:

答案 0 :(得分:0)

您可以使用next指向下一行的高级指针:

my_string = open("SimpleFsastaFile.fa", "r")
next(my_string)                  # advanced file pointer to next line
my_string.read()

答案 1 :(得分:-2)

如果您需要整个文件的内容,为什么不一次读取所有行并立即切掉第一行?

with open('path','r') as f:
    content = f.readlines()[1:]
output="".join(content)