import requests
from bs4 import BeautifulSoup
urla = 'https://www.tumblr.com/search/hello'
r = requests.get(urla)
soupa = BeautifulSoup(r.content, 'html.parser')
links = soupa.find_all("div", {"class": "header_mage_wrapper has_avatar"})
for link in links:
print link
因此,在运行此代码后,没有任何内容破坏,我得到退出代码0(使用PyCharm),但根本没有输出。
如果我带走{“class”:“header_mage_wrapper has_avatar”}) 所以只有find_all(“div”),它工作得很好并且可以拉出所有的div。我尝试使用不同的网站使用相同的代码并且没有任何问题,我确定它是一些我还不知道的小东西,我只使用了BeautifulSoup一两天,但我找不到问题是因为没有编码错误。
谢谢!
答案 0 :(得分:0)
这不会输出任何内容:
import requests
from bs4 import BeautifulSoup
urla = 'https://www.tumblr.com/search/hello'
r = requests.get(urla)
soup = BeautifulSoup(r.text)
for link in soup.find_all('div', class_="header_image_wrapper has_avatar"):
print(link.get('class'))
这是因为get()
没有提取header_image_wrapper
类。
它取得的最低值是search_blog_row
。
您要搜索的header_image_wrapper
会根据您的搜索动态加载。
因此,您可以尝试POST
here。
相反,我建议使用Tumblr API来获得结果。