not wel formated(无效令牌)ElementTree python

时间:2017-10-13 13:00:16

标签: python xml parsing elementtree

我想解析大的xml文件。

解析时我遇到网络错误:

not well-formed (invalid token): line 1508, column 87

行和列可能不同。

在最初的几种情况下,我重新格式化xml,并继续解析。

但现在我无法看到错误的原因,这是需要的地方:

look_downwards_(upon?)_the_zebus_&_sevens:coroner_"the_original

特别是在' n'之后之前的'在sevens中

现在我有两个问题。

  1. 如何重新格式化htis xml以解决此错误。
  2. 我需要做什么,以避免所有错误,因为文档太大,错误发生得太频繁,从人类的角度来看错误并不是很重要?
  3. P.S。我用不同的编码尝试了这个

0 个答案:

没有答案