我希望在循环浏览并扩展所有"更多>>"后,在Vermont SoS上下载给定页面的HTML表格。声明。目前看,结果是乡镇的,我试图通过区域来刮掉它们。
可在此处找到示例页面: http://vtelectionarchive.sec.state.vt.us/elections/view/68156
以下代码可以很好地解析表格:
library(XML)
htmlParse("http://vtelectionarchive.sec.state.vt.us/elections/view/68156/")
这是产生的:
$`NULL`
NULL
$precinct_data
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1 Totals 123,349 59,432 2,750 2,071 2,024 1,685 126 3,009 194,446
2 Addison 284 252 2 4 4 2 0 0 548
3 Albany 186 114 4 6 10 4 0 0 324
4 Alburgh 383 197 11 7 9 6 0 0 613
5 Andover 105 96 7 0 2 0 0 0 210
6 Arlington 477 255 23 4 16 4 0 0 779
7 Athens 51 39 5 3 0 0 0 0 98
8 Bakersfield 237 116 6 3 3 4 0 0 369
9 Baltimore 27 32 6 1 1 1 0 0 68
10 Barnard 265 143 4 1 6 1 0 0 420
11 Barnet 353 235 5 6 4 11 0 0 614
然而,我想要包括所有区域数据。如何扩展所有这些语句,保留这些cookie,然后导出页面?