Question

嗨，这是我的代码，用于检索ycombinator网站中的第一个主题。当我运行代码时，我得到了

AttributeError: 'NoneType' object has no attribute 'find'for the line 
level2= data.level1.find('table',attrs = {'id':'hnmain'})

主题嵌套在各种标签内，这就是我进行如下操作的原因。我只是为了练习这样做，所以我知道这可能不是最好的编码方式，因为它是我的第一天，我只是想知道如何克服错误。

import requests
from bs4 import BeautifulSoup
response1= requests.get('https://news.ycombinator.com/')
response = response1.text

data = BeautifulSoup(response,"html.parser")

level1= data.body.find('centre')
level2= data.level1.find('table',attrs = {'id':'hnmain'})
level3= data.level2.find('tbody')
level4= data.level3.find('tr')
level5= data.level4.find('td')
level6= data.level5.find('table.itemlist')
level7= data.level6.find('tbody')
level8= data.level7.find('tr#15426209.athing')
level9= data.level8.find('td.title')
level10= data.level9.find('a.storylink')
print(level10.text)

Answer 1

我认为你因data.body部分而收到错误。我从来没有见过这样做过。

以下是您的代码的修改版本：

import requests
from bs4 import BeautifulSoup

r = requests.get('https://news.ycombinator.com')

soup = BeautifulSoup(r.text, 'lxml')

# print soup.prettify()

stories = []

for a in soup.find_all('a', attrs={'class': 'storylink'}):
    stories.append([a.text, a['href']])

print stories[0]

[u'Using Binary Diffing to Discover Windows Kernel Memory Disclosure Bugs', 'https://googleprojectzero.blogspot.com/2017/10/using-binary-diffing-to-discover.html']

我已经注释掉了soup.prettify()，但您可以取消注释并查看它的作用 - 它以非常有条理的方式向您显示页面的源代码。

Answer 2

错误的来源是..

来自美丽的汤文档 - 如果find()无法找到任何内容，则会返回None。

由于拼写不正确，它肯定无法找到您想要的centre标记。

此外，您将要从较低级别删除data，因为第一级已经返回标记元素对象。level2= level1.find('table',attrs = {'id':'hnmain'})

我仍然在3级之后被抓住了...我掠过了返回值并且tbody没有出现在任何地方..所以我不确定树在哪里突然转向。

我得到了AttributeError：'NoneType'对象没有属性'find'

2 个答案: