R- Scraping维基百科列表到表中

时间:2016-12-14 20:47:22

标签: r web-scraping wikipedia

我正在尝试使用R从维基百科页面(https://en.wikipedia.org/wiki/List_of_hub_airports)上的列表创建一个美国枢纽机场的表格。我是网络抓取的新手,所以对此有任何帮助或建议将不胜感激。我试图从每个美国州获得一个类似于以下的表格。

Example of airport hub table

谢谢!

1 个答案:

答案 0 :(得分:0)

虽然整个项目将是一个挑战,但这是开始拉动美国数据。

library(rvest)
site <- "https://en.wikipedia.org/wiki/List_of_hub_airports"
txt <- read_html(site) %>%
  html_nodes("#mw-content-text :nth-child(1)") %>%
  html_text()
usatext <- txt[1866:2329]