fasta文件的结构如下:
>gi|568815364|ref|NT_077402.3| Homo sapiens chromosome 1 genomic scaffold, GRCh38 Primary Assembly HSCHR1_CTG1
TAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAAC
CCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCAACCCTAACCCTAACCCTAACCCTAACCCTAA
CCCTAACCCCTAACCCTAACCCTAACCCTAACCCTAACCTAACCCTAACCCTAACCCTAACCCTAACCCT
AACCCTAACCCTAACCCTAACCCCTAACCCTAACCCTAAACCCTAAACCCTAACCCTAACCCTAACCCTA
ACCCTAACCCCAACCCCAACCCCAACCCCAACCCCAACCCCAACCCTAACCCCTAACCCTAACCCTAACC
第一行是关于文件内容的一些信息,其余行是DNA,RNA或氨基酸的链。 要对这种文件做一些工作,我需要删除第一行文件。我怎么能用python做到这一点? 我试过这段代码,但不适合:
My_string=open("SimpleFastaFile.fa", "r").read()
def line_remove(str):
if str.isalnum()==False:
str=str[1:]
line_remove(str)
line_remove(My_string)
答案 0 :(得分:0)
您可以使用next
指向下一行的高级指针:
my_string = open("SimpleFsastaFile.fa", "r")
next(my_string) # advanced file pointer to next line
my_string.read()
答案 1 :(得分:-2)
如果您需要整个文件的内容,为什么不一次读取所有行并立即切掉第一行?
with open('path','r') as f:
content = f.readlines()[1:]
output="".join(content)