我想从此网站获取值:http://cdn.ime-co.ir/ BeautifulSoup ,但在尝试导入表时值为空。我认为禁用javascrip或任何我不知道的东西。 请帮我将值导出为csv或txt格式。
import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://cdn.ime-co.ir/').read())
print soup
答案 0 :(得分:0)
BeautifulSoup不支持Javascript。如果你只需要解析它,你可以明显地将源保存到文件并从那里解析。如果您需要多次获取该站点,可以使用Webkit(here's an example using PyQT4 with Webkit)或PhantomJS来生成可以在Python中解析的源。