我是HTML解析器的新手。我实际上是尝试使用网址(http://www.quora.com/How-many-internships-are-necessary-for-a-B-Tech-student)解析网页的源代码。我试图获得answer_count。
我按照以下方式尝试了它:
import urllib2
from bs4 import BeautifulSoup
q = urllib2.urlopen(url)
soup = BeautifulSoup(q)
divs = soup.find_all('div',class_='answer_count')
但我得到了列表' divs'空的。为什么会这样?我哪里错了?如何实现它以获得结果' 2答案'?
答案 0 :(得分:2)
也许您在浏览器上没有与我们相同的页面(因为您已登录等)。
当我查看您使用Google Chrome浏览器提供的网页时,源代码中没有'answer_count'。因此,如果Google Chrome没有找到它,那么BeautifulSoup也不会