BeautifulSoup找不到,findAll,或通过其ID获取div

时间:2017-11-29 12:22:19

标签: python python-2.7 beautifulsoup python-requests

最近两天我一直在这里不停...... 我尝试使用BeautifulSoup通过其ID获取特定div:

import requests
from bs4 import BeautifulSoup

r = requests.get('www.example.com', cookies=cookies_dict)
soup = BeautifulSoup(r.content, 'html.parser')
div_text = soup.get('div', {'id': 'this_div_id'}).text
print div_text

我得到的只是一本字典:

{'id': 'this_div_id'}

现在,我检查确保' this_div_id'实际上是在r.content中:

>>> 'this_div_id' in r.content
True

我很高兴收到任何帮助和建议。

1 个答案:

答案 0 :(得分:0)

错误......也许你应该再次查看BeautifulSoup文档? - )

  

帮助方法获取模块bs4.element:

     

get(self,key,default = None)unbound bs4.BeautifulSoup方法       返回'键的值'标签的属性,或       为'默认'如果没有那个       属性。

我认为你想要find()方法:

>>> html = """<html><body><div><div><div id='this_div_id'>haha</div></div></div>"""
>>> from bs4 import BeautifulSoup
>>> s = BeautifulSoup(html, 'html.parser')
>>> s.find("div")
<div><div><div id="this_div_id">haha</div></div></div>
>>> s.find("div", id="this_div_id")
*<div id="this_div_id">haha</div>
>>>