无法抓取并访问文本文件中的特定div

时间:2015-08-31 13:37:44

标签: python web-scraping web-crawler

我有以下代码,我想访问特定div的文本。

from bs4 import BeautifulSoup
import requests
import urlparse
example = open('example.txt')
html = example.read()



def gettext(htmltext):
    soup=BeautifulSoup(htmltext, "lxml")
    for div in soup.findAll('div', attrs={'class':'_5pbx userContent'}):
        print div.text

gettext(html)

首先,我通过指向facebook个人资料的链接尝试了它,但它没有用。但现在我复制了整个源代码并将其保存在example.txt文件中。但是,它无法访问类_5pbx usercontent的div。您可以在

下载源代码
  

视图源:https://www.facebook.com/abhas.mittal7?fref=ts

请制作example.txt文件并尝试运行我的代码。我不知道是什么问题。请帮助我。

0 个答案:

没有答案