使用Python进行Web抓取,但值为空

时间:2013-06-10 20:26:49

标签: javascript python web-scraping beautifulsoup screen-scraping

我想从此网站获取值:http://cdn.ime-co.ir/ BeautifulSoup ,但在尝试导入表时值为空。我认为禁用javascrip或任何我不知道的东西。 请帮我将值导出为csv或txt格式。

import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://cdn.ime-co.ir/').read())
print soup

1 个答案:

答案 0 :(得分:0)

BeautifulSoup不支持Javascript。如果你只需要解析它,你可以明显地将源保存到文件并从那里解析。如果您需要多次获取该站点,可以使用Webkit(here's an example using PyQT4 with Webkit)或PhantomJS来生成可以在Python中解析的源。