我试图使用R来抓取加利福尼亚州几百个城市的city-data.com数据,并从网站上返回一个漂亮的表格(行=城市,列=城市变量)。我希望能够输入一个URL列表,每个城市一个。现在,我可以使用以下方法为单个记录抓取单个城市网址
library(XML)
city.url = c("http://www.city-data.com/city/Acalanes-Ridge-California.html"
city.df = readHTMLTable(city.url, header=T, which=2, stringsAsFactors=F)
head(city.df,1)
它返回: 男性:568(50.0%) 1女性:569(50.0%)
我真的很感激任何建议。 Dollar General正在努力建立我们的社区,并且我试图快速整理影响分析,以检查在建立Dollar General之后小城镇会发生什么。谢谢!