自动填写使用ASP的表单

时间:2012-10-26 22:18:30

标签: python web-scraping

我正在尝试编写一些代码,以自动填充此网络表单:

http://scoweb.sco.ca.gov/UCP/

然后阅读返回的结果。我会找到我的名字,并在我有UCP时通知自己。

我曾尝试用C#(System.Net),curl(与formfind结合),Ruby(Mechanize)和Python(Scrapy,urllib2)编写程序。 我的所有脚本都在与数据库通信的常规HTML表单上工作,但这个表单什么都不返回。

我的理论是因为该网站使用ASP而我没有做些什么来解释这个问题?

任何工作代码,虽然python首选,填写表单并返回结果将非常感激。

2 个答案:

答案 0 :(得分:0)

我认为问题是因为表单使用了javascript。您可以将selenium用于http://seleniumhq.org/

这样的事情

答案 1 :(得分:0)

#!/usr/bin/env python

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException
import unittest, time, re

class Shiply(unittest.TestCase):
    def setUp(self):
        self.driver = webdriver.Firefox()
        self.driver.implicitly_wait(30)
        self.base_url = "http://scoweb.sco.ca.gov/"  #California UCP
        self.verificationErrors = []

    def test_shiply(self):
        driver = self.driver
        driver.get(self.base_url + "/UCP/")
        driver.find_element_by_id("ctl00_ContentPlaceHolder1_txtLastName").clear()
        driver.find_element_by_id("ctl00_ContentPlaceHolder1_txtLastName").send_keys("YOUR_NAME")
        driver.find_element_by_id("ctl00_ContentPlaceHolder1_btnSearch").click()

    def is_element_present(self, how, what):
        try: self.driver.find_element(by=how, value=what)
        except NoSuchElementException, e: return False
        return True

    def tearDown(self):
        self.driver.quit()
        self.assertEqual([], self.verificationErrors)

if __name__ == "__main__":
    unittest.main()