如何使用python抓取javascript生成的数据

时间:2013-07-14 00:50:26

标签: javascript python

我想要抓住以下新闻的参与者人数。 网址为http://news.sina.com.cn/c/2013-07-11/175827642839.shtml 而且我想获得数字820。 它是由javascript生成的。 如何以简单的方式获得该数字?

1 个答案:

答案 0 :(得分:1)

你可以分析javascript代码并在python中做同样的事情。 或者您可以在Python中使用Selenium

修改

这里来自selenium页面的例子改为做你需要的。

打开浏览器(firefox),等待5秒钟(加载页面)并获取文本

#!/usr/bin/python

import selenium
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
import time

browser = webdriver.Firefox() # Get local session of firefox
browser.get("http://news.sina.com.cn/c/2013-07-11/175827642839.shtml ") # Load page
time.sleep(5) # Let the page load
try:
    element = browser.find_element_by_xpath("//span[contains(@class,'f_red')]") # get element on page
    print element.text # get element text
except NoSuchElementException:
    assert 0, "can't find f_red"
browser.close()