我正在尝试从网页中提取数据 https://www.geojit.com/other-market/world-indices 还有许多与此类似的东西。
我需要获取网站的表格数据(INDEX,NAME,COUNTRY,CLOSE,PREV.CLOSE,NET CHANGE,CHANGE(%),最后更新日期和时间)。如果您可以为此共享R代码,那将是很棒的,否则任何帮助都将受到欢迎。
library(rvest)
library(dplyr)
google <- html("https://www.geojit.com/other-market/world-indices")
google %>%
html_nodes()
答案 0 :(得分:2)
library(rvest)
my_tbl <- read_html("https://www.geojit.com/other-market/world-indices") %>%
html_nodes(xpath = "//*[@id=\"aboutContent\"]/div[2]/table") %>%
html_table(header = TRUE) %>%
`[[`(1)