在R和webscraping结果中将值输入到aspx表单中

时间:2015-01-28 20:30:25

标签: asp.net r forms screen-scraping

我正在尝试使用县网站来搜索属性信息 首先我要webscrape: 网址:http://reparcelasmt.loudoun.gov/search/commonsearch.aspx?mode=parid 例如: 输入税收包裹ID#of" 123205197000" 单击“搜索” 单击该行以查看属性详细信息 选择住宅选项卡 在" Primary Building"

下面刮桌子

我到目前为止所做的第二件事: 我使用Scraping from aspx website

取得了一些进展
require(httr)
require(XML)
basePage <- "http://reparcelasmt.loudoun.gov"
h <- handle(basePage)
GET(handle = h)
res <- GET(handle = h, path = "/search/commonsearch.aspx?mode=parid")
resXML <- htmlParse(content(res, as = "text"))

在查看resXML时,我发现下面的html代码我认为可能需要填写并以某种方式提交。我认为可能与HTML相关的关键字是:id =&#34; Form1&#34;和id =&#34;行动&#34;

<form name="Form1" method="post" action="Disclaimer.aspx?FromUrl=..%2fsearch%2fcommonsearch.aspx%3fmode%3dparid" id="Form1">

<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="/wEPDwUKLTg0Mjk5NDk3MWRkj8q93u53cL62jCmCkDzR+iRJJ70=">
<input type="hidden" name="__EVENTVALIDATION" id="__EVENTVALIDATION" value="/wEWBQL8q9ymDgLpuJU7Aub60+ELAuO8lrkBAtL2kugI8BSyTTneHZXvLUVQf7YJFvW03XQ=">
<table cellpadding="1" width="430" align="center">
<tr>
<td align="center">
<input onclick="__doPostBack('btDisagree','')" name="btDisagree" type="button" id="btDisagree" class="MenuButton" style="WIDTH: 100px" value="Disagree">
</td><td align="center">
<input onclick="__doPostBack('btAgree','')" name="btAgree" type="button" id="btAgree" class="MenuButton" style="WIDTH: 100px" value="Agree">
</td></tr></table>
<input name="hdURL" type="hidden" id="hdURL" value="../search/commonsearch.aspx?mode=parid">
<input name="action" type="hidden" id="action">
</form>

如果有人对如何进行有任何想法,那就太棒了。

谢谢。 马特

0 个答案:

没有答案