我不熟悉网页抓取,虽然我已经设法在几个小时内获得了一些内容。但是,这次虽然我的问题看起来很简单,但我无法在网页中获得包含符号,名称和市场的字符串。也就是说,我想得到字符串“Merck KGaA(MRK.DE) -XETRA“在网址中。我已经尝试了以下代码,它返回了几张桌子,但我无法得到我正在寻找的作品:
url <- 'https://finance.yahoo.com/q?s=MRK.DE&ql=0'
require(httr)
require(XML)
table <- readHTMLTable(content(GET(url)),header=TRUE)
答案 0 :(得分:1)
这可能不是这里最有效的脚本,但它肯定会起作用:
library(rvest)
library(magrittr)
library(stringr)
html(url) %>%
html_nodes("h2") %>%
extract2(3) %>%
as('character') %>%
str_replace('<h2>', '') %>%
str_replace('</h2>', '')
[1] "Merck KGaA (MRK.DE)"