Question

import requests
from bs4 import BeautifulSoup

urla = 'https://www.tumblr.com/search/hello'

r = requests.get(urla)

soupa = BeautifulSoup(r.content, 'html.parser')

links = soupa.find_all("div", {"class": "header_mage_wrapper has_avatar"})

for link in links:

    print link

因此，在运行此代码后，没有任何内容破坏，我得到退出代码0（使用PyCharm），但根本没有输出。

如果我带走{“class”：“header_mage_wrapper has_avatar”}）所以只有find_all（“div”），它工作得很好并且可以拉出所有的div。我尝试使用不同的网站使用相同的代码并且没有任何问题，我确定它是一些我还不知道的小东西，我只使用了BeautifulSoup一两天，但我找不到问题是因为没有编码错误。

谢谢！

Answer 1

这不会输出任何内容：

import requests
from bs4 import BeautifulSoup
urla = 'https://www.tumblr.com/search/hello'
r = requests.get(urla)
soup = BeautifulSoup(r.text)

for link in soup.find_all('div', class_="header_image_wrapper has_avatar"):
    print(link.get('class'))

这是因为get()没有提取header_image_wrapper类。它取得的最低值是search_blog_row。

您要搜索的header_image_wrapper会根据您的搜索动态加载。

因此，您可以尝试POST here。

相反，我建议使用Tumblr API来获得结果。

没有美丽的汤find_all输出

1 个答案: