我是BeautifulSoup的新手,并且从Quora
抓取了关于主题'GRE' link的不同问题/答案对。
在抓取后,我查看了已抓取的问题答案对,并注意到,已抓取的答案对的顺序与网站上实际的顺序不同。
在this问题中,答案表明find_all
确实保留了订单,但是在我的情况下,使用find_all
并不能帮助保留订单。
我在哪里出错了?请帮助!!
以下是抓取代码:
from bs4 import BeautifulSoup
import requests
r = requests.get('https://www.quora.com/topic/Graduate-Record-Examination-GRE-1')
soup = BeautifulSoup(r.text,'lxml')
#print(soup.prettify())
#match = soup.title
#match
#match.text
#a = soup.find('link', id_ = 'wxlJClxd1')
#a = soup.find('div', class_ = 'AnswerStoryBundle Bundle')#.find('div', id_ = '__w2_waNcSF3r41_paged_list')
a = soup.find_all('div',{'class':'AnswerStoryBundle Bundle'})
for i in a:
print(i.text,'\n')
---------
我不明白为什么订购会有所不同?