没有美丽的汤find_all输出

时间:2016-05-28 03:58:36

标签: python beautifulsoup

import requests
from bs4 import BeautifulSoup

urla = 'https://www.tumblr.com/search/hello'

r = requests.get(urla)

soupa = BeautifulSoup(r.content, 'html.parser')

links = soupa.find_all("div", {"class": "header_mage_wrapper has_avatar"})

for link in links:

    print link

因此,在运行此代码后,没有任何内容破坏,我得到退出代码0(使用PyCharm),但根本没有输出。

如果我带走{“class”:“header_mage_wrapper has_avatar”}) 所以只有find_all(“div”),它工作得很好并且可以拉出所有的div。我尝试使用不同的网站使用相同的代码并且没有任何问题,我确定它是一些我还不知道的小东西,我只使用了BeautifulSoup一两天,但我找不到问题是因为没有编码错误。

谢谢!

1 个答案:

答案 0 :(得分:0)

这不会输出任何内容:

import requests
from bs4 import BeautifulSoup
urla = 'https://www.tumblr.com/search/hello'
r = requests.get(urla)
soup = BeautifulSoup(r.text)

for link in soup.find_all('div', class_="header_image_wrapper has_avatar"):
    print(link.get('class'))

这是因为get()没有提取header_image_wrapper类。 它取得的最低值是search_blog_row

您要搜索的header_image_wrapper会根据您的搜索动态加载。

因此,您可以尝试POST here

相反,我建议使用Tumblr API来获得结果。