我在Python 3.4的BeautifulSoup 4中使用xml
解析器时遇到了以下意外行为。解析xml样式表时,结束分隔符中的问号消失了:
输入:
BeautifulSoup('<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="myStyleSheet.xsl" type="text/xsl"?>','xml')
输出:
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet href="myStyleSheet.xsl" type="text/xsl">
注意type="text/xsl"?>
如何更改为type="text/xsl">
。
此外,发现here的示例以相同方式中断。
这是故意的吗?我应该报告错误吗?除了在之后的正确位置插入问号之外,还有什么方法可以防止这种情况吗?答案 0 :(得分:1)
来自2016年7月19日发布的BeautifulSoup 4.5.0版的更新日志:
&#34; *更正了XML处理指令的处理。 [错误= 1504393]&#34;