BeautifulSoup并找到

时间:2011-06-24 10:43:01

标签: python html beautifulsoup

我有一个HTML代码:

<div id='div1'>
    <div id='d'> </div>
    <p></p>
</div>

如何在id为div1的div中获取所有内容? soup.find('div',{'id':“div1”})返回:

<div id='div1'>
    <div id='d'> </div>
    <p></p>
</div>

我只需得到:

<div id='d'> </div>
<p></p> 

2 个答案:

答案 0 :(得分:4)

请参阅documentation,特别是.find().contents

答案 1 :(得分:0)

您希望标记的开头和结尾之间的内容包括所有子标记。

soup.find('div', id="div1").contents