Question

我想从此网站获取值：http://cdn.ime-co.ir/ BeautifulSoup ，但在尝试导入表时值为空。我认为禁用javascrip或任何我不知道的东西。请帮我将值导出为csv或txt格式。

import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://cdn.ime-co.ir/').read())
print soup

Answer 1

BeautifulSoup不支持Javascript。如果你只需要解析它，你可以明显地将源保存到文件并从那里解析。如果您需要多次获取该站点，可以使用Webkit（here's an example using PyQT4 with Webkit）或PhantomJS来生成可以在Python中解析的源。

使用Python进行Web抓取，但值为空

1 个答案: