我想要一些建议来解决xml解析错误。在我的BLAST xml输出中,我有一个带有'&'字符的描述,该描述抛弃了SearchIO.parse函数。
如果我运行
qresults=SearchIO.parse(PLAST_output,"blast-xml")
for record in qresults:
#do some stuff
我收到以下错误:
cElementTree.ParseError: not well-formed (invalid token): line 13701986, column 30
将我引导至此行:
<Hit_def>Lysosomal & prostatic acid phosphatases [Xanthophyllomyces dendrorhous</Hit_def>
有没有一种方法可以在biopython中覆盖它,因此我不必更改xml文件?现在,我只是在做一个“ Try / Except”循环,但这并不是最佳选择!
感谢您的帮助! 考特尼