使用rvest刮取HTML - 获取http错误416

时间:2015-06-27 18:59:17

标签: html r scrape rvest

我正在尝试使用R(包rvest)来抓取此页面的HTML,但我收到“客户端错误416:请求的范围不满意”

经过长时间的搜索,我似乎无法找到解决方案。它在尝试使用rvest的html函数时抛出错误,该函数解析HTML页面:

url <- "http://shop.tcgplayer.com/magic/onslaught/polluted-delta"
html(url)

我使用的是R版本3.2.0。

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:0)

您非常接近,只需使用现已更新的url read_html继续提取> read_html(url) %>% + html_nodes("table") %>% + html_text() %>% + .[[1]] [1] "\r\n Rarity:\r\n R\r\n Card Type:\r\n Land \r\n Description:\r\n Tap, Pay 1 life, Sacrifice Polluted Delta: Search your library for an island or swamp card and put it into play. Then shuffle your library.\r\n\r\n \r\n "

swagDoc.properties["JsonData"].properties.Add("Parent", new Schema() { type = "array" });