Question

fasta文件的结构如下：

>gi|568815364|ref|NT_077402.3| Homo sapiens chromosome 1 genomic scaffold, GRCh38 Primary Assembly HSCHR1_CTG1
TAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAAC
CCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCAACCCTAACCCTAACCCTAACCCTAACCCTAA
CCCTAACCCCTAACCCTAACCCTAACCCTAACCCTAACCTAACCCTAACCCTAACCCTAACCCTAACCCT
AACCCTAACCCTAACCCTAACCCCTAACCCTAACCCTAAACCCTAAACCCTAACCCTAACCCTAACCCTA
ACCCTAACCCCAACCCCAACCCCAACCCCAACCCCAACCCCAACCCTAACCCCTAACCCTAACCCTAACC

第一行是关于文件内容的一些信息，其余行是DNA，RNA或氨基酸的链。要对这种文件做一些工作，我需要删除第一行文件。我怎么能用python做到这一点？我试过这段代码，但不适合：

My_string=open("SimpleFastaFile.fa", "r").read()
def line_remove(str):
    if str.isalnum()==False:
        str=str[1:]
        line_remove(str)

line_remove(My_string)

Answer 1

您可以使用next指向下一行的高级指针：

my_string = open("SimpleFsastaFile.fa", "r")
next(my_string)                  # advanced file pointer to next line
my_string.read()

Answer 2

如果您需要整个文件的内容，为什么不一次读取所有行并立即切掉第一行？

with open('path','r') as f:
    content = f.readlines()[1:]
output="".join(content)

如何从fasta文件中删除第一行？

2 个答案: