Web抓取R-我可以从该页面提取数据还是仅提取图片?

时间:2018-08-08 14:32:36

标签: r web-scraping

我正在查看此ULR: https://finanzen.handelsblatt.com/22394404/lng-japan-korea-marker-platts 谁能告诉我是否可以提取图形数据或仅提取包含数据的图形?

我真的不熟悉这种结构,并且在检查页面时没有进一步了解。

非常感谢!

1 个答案:

答案 0 :(得分:2)

围绕“ rvest”进行一些研究。这是一个片段;

library(rvest)

url <- 'https://finanzen.handelsblatt.com/22394404/lng-japan-korea-marker-platts'
pg <- read_html(url)

pg %>% html_nodes('h1') %>% html_text()
pg %>% html_nodes('.vhb-full-width .vhb-after') %>% html_text()

## > pg %>% html_nodes('h1') %>% html_text()
##[1] "LNG Japan/Korea Marker (Platts" 
##> pg %>% html_nodes('.vhb-full-width .vhb-after') %>% html_text()
##[1] "9,81"