美丽的汤不会读取多个根标签

时间:2018-02-10 20:35:49

标签: xml beautifulsoup

我有一个看起来像这样的标记文件:

<d id="0001" type="story"><P>xxx</P></d>
<d id="0002" type="story"><P>yyy</P></d>

我正在使用Beautiful Soup的'xml'解析器。

当我要求漂亮的印刷品时,它只会打印第一张,而不是第二张。另外,当我致电soup.find_all("d")时,该列表只会包含一个<d></d>。我想知道如何进入第二个d,即id为0002的那个。

漂亮的印刷结果:

<?xml version="1.0" encoding="utf-8"?>
<d id="0001" type="story">
 <P>
  xxx
 </P>
</d>

当我在它周围添加另一层时,解析器将同时获得两个:

<c>
<d id="0001" type="story"><P>xxx</P></d>
<d id="0002" type="story"><P>yyy</P></d>
</c>

我只是不明白为什么它不允许2个或更多平行线的平面结构。

0 个答案:

没有答案