应用错误收集

美丽的汤不会读取多个根标签

时间：2018-02-10 20:35:49

标签： xml beautifulsoup

我有一个看起来像这样的标记文件：

<d id="0001" type="story"><P>xxx</P></d>
<d id="0002" type="story"><P>yyy</P></d>

我正在使用Beautiful Soup的'xml'解析器。

当我要求漂亮的印刷品时，它只会打印第一张，而不是第二张。另外，当我致电soup.find_all("d")时，该列表只会包含一个<d></d>。我想知道如何进入第二个d，即id为0002的那个。

漂亮的印刷结果：

<?xml version="1.0" encoding="utf-8"?>
<d id="0001" type="story">
 <P>
  xxx
 </P>
</d>

当我在它周围添加另一层时，解析器将同时获得两个：

<c>
<d id="0001" type="story"><P>xxx</P></d>
<d id="0002" type="story"><P>yyy</P></d>
</c>

我只是不明白为什么它不允许2个或更多平行线的平面结构。

0 个答案:

没有答案