Question

我希望在循环浏览并扩展所有＆＃34;更多＆gt;＆gt;＆＃34;后，在Vermont SoS上下载给定页面的HTML表格。声明。目前看，结果是乡镇的，我试图通过区域来刮掉它们。

可在此处找到示例页面： http://vtelectionarchive.sec.state.vt.us/elections/view/68156

以下代码可以很好地解析表格：

library(XML)

htmlParse("http://vtelectionarchive.sec.state.vt.us/elections/view/68156/")

这是产生的：

$`NULL`
NULL

$precinct_data
                                V1      V2     V3    V4    V5    V6    V7  V8    V9     V10
1                           Totals 123,349 59,432 2,750 2,071 2,024 1,685 126 3,009 194,446
2                          Addison     284    252     2     4     4     2   0     0     548
3                           Albany     186    114     4     6    10     4   0     0     324
4                          Alburgh     383    197    11     7     9     6   0     0     613
5                          Andover     105     96     7     0     2     0   0     0     210
6                        Arlington     477    255    23     4    16     4   0     0     779
7                           Athens      51     39     5     3     0     0   0     0      98
8                      Bakersfield     237    116     6     3     3     4   0     0     369
9                        Baltimore      27     32     6     1     1     1   0     0      68
10                         Barnard     265    143     4     1     6     1   0     0     420
11                          Barnet     353    235     5     6     4    11   0     0     614

然而，我想要包括所有区域数据。如何扩展所有这些语句，保留这些cookie，然后导出页面？

展开网页元素后下载HTML表格

0 个答案: