R中的Web抓取readHTMLTable错误与功能

时间:2019-07-19 21:01:29

标签: r web-scraping html-table

我正在R中自学一些基本的表格Web抓取技术。但是我在运行函数readHTMLTable时看到错误。

  

无法找到函数“ readHTMLTable”的继承方法作为签名““ NULL””

我专门尝试读取第二张表中的数据。我已经检查了页面源代码,以确保该表的格式为<table><td>

release_table <- readHTMLTable("https://www.comichron.com/monthlycomicssales/1997/
                               1997-01.html", header=TRUE, which=2,stringsAsFactors=F)

我希望输出能够反映第二张表中的文本。

1 个答案:

答案 0 :(得分:0)

我们可以使用rvest来获取所有表。

url <- "https://www.comichron.com/monthlycomicssales/1997/1997-01.html"
library(rvest)
tab <- url %>%  read_html() %>%  html_table()

我认为您正在寻找的是tab[[1]]tab[[4]]