XML解析器删除处理指令关闭分隔符的问号

时间:2016-07-07 13:21:24

标签: xml python-3.x beautifulsoup

我在Python 3.4的BeautifulSoup 4中使用xml解析器时遇到了以下意外行为。解析xml样式表时,结束分隔符中的问号消失了:

输入:

BeautifulSoup('<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="myStyleSheet.xsl" type="text/xsl"?>','xml')

输出:

<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet href="myStyleSheet.xsl" type="text/xsl">

注意type="text/xsl"?>如何更改为type="text/xsl">

此外,发现here的示例以相同方式中断。

这是故意的吗?我应该报告错误吗?除了在之后的正确位置插入问号之外,还有什么方法可以防止这种情况吗?

1 个答案:

答案 0 :(得分:1)

来自2016年7月19日发布的BeautifulSoup 4.5.0版的更新日志:

&#34; *更正了XML处理指令的处理。 [错误= 1504393]&#34;