SearchIO.parse xml爆炸和“&”号cElementTree.ParseError:格式不正确(无效的令牌)错误

时间:2018-07-05 16:56:08

标签: biopython

我想要一些建议来解决xml解析错误。在我的BLAST xml输出中,我有一个带有'&'字符的描述,该描述抛弃了SearchIO.parse函数。

如果我运行

qresults=SearchIO.parse(PLAST_output,"blast-xml")

for record in qresults:
    #do some stuff

我收到以下错误:

cElementTree.ParseError: not well-formed (invalid token): line 13701986, column 30

将我引导至此行:

<Hit_def>Lysosomal & prostatic acid phosphatases [Xanthophyllomyces dendrorhous</Hit_def>

有没有一种方法可以在biopython中覆盖它,因此我不必更改xml文件?现在,我只是在做一个“ Try / Except”循环,但这并不是最佳选择!

感谢您的帮助! 考特尼

0 个答案:

没有答案