最近两天我一直在这里不停...... 我尝试使用BeautifulSoup通过其ID获取特定div:
import requests
from bs4 import BeautifulSoup
r = requests.get('www.example.com', cookies=cookies_dict)
soup = BeautifulSoup(r.content, 'html.parser')
div_text = soup.get('div', {'id': 'this_div_id'}).text
print div_text
我得到的只是一本字典:
{'id': 'this_div_id'}
现在,我检查确保' this_div_id'实际上是在r.content中:
>>> 'this_div_id' in r.content
True
我很高兴收到任何帮助和建议。
答案 0 :(得分:0)
错误......也许你应该再次查看BeautifulSoup
文档? - )
帮助方法获取模块bs4.element:
get(self,key,default = None)unbound bs4.BeautifulSoup方法 返回'键的值'标签的属性,或 为'默认'如果没有那个 属性。
我认为你想要find()
方法:
>>> html = """<html><body><div><div><div id='this_div_id'>haha</div></div></div>"""
>>> from bs4 import BeautifulSoup
>>> s = BeautifulSoup(html, 'html.parser')
>>> s.find("div")
<div><div><div id="this_div_id">haha</div></div></div>
>>> s.find("div", id="this_div_id")
*<div id="this_div_id">haha</div>
>>>