BeautifulSoup非常适合非常简单地修复格式错误的XML:
import bs4
value = unicode(bs4.BeautifulSoup(value, "xml"))
但在处理这种XML时:
<draw:image xlink:href="Pictures/image.png" xlink:type="simple" xlink:show="embed" xlink:actuate="onLoad"/>
它给了我:
<image actuate="onLoad" href="Pictures/image.png" show="embed" type="simple"/>
我想保持原状!如何判断BeautifulSoup不要太聪明?
答案 0 :(得分:0)
在仔细查看整个文档之后,我看到一些名称空间定义不再存在了。添加它们后,达到了所需的行为。