Question

我正在尝试从网页中提取数据 https://www.geojit.com/other-market/world-indices 还有许多与此类似的东西。

我需要获取网站的表格数据（INDEX，NAME，COUNTRY，CLOSE，PREV.CLOSE，NET CHANGE，CHANGE（％），最后更新日期和时间）。如果您可以为此共享R代码，那将是很棒的，否则任何帮助都将受到欢迎。

library(rvest)
library(dplyr)   
google <- html("https://www.geojit.com/other-market/world-indices")    
google %>%    
html_nodes()

Answer 1

library(rvest)
my_tbl <- read_html("https://www.geojit.com/other-market/world-indices") %>%    
  html_nodes(xpath = "//*[@id=\"aboutContent\"]/div[2]/table") %>%
  html_table(header = TRUE) %>%
  `[[`(1)

如何使用R从网站提取表格数据

1 个答案: