Question

我正在R中自学一些基本的表格Web抓取技术。但是我在运行函数readHTMLTable时看到错误。

无法找到函数“ readHTMLTable”的继承方法作为签名““ NULL””

我专门尝试读取第二张表中的数据。我已经检查了页面源代码，以确保该表的格式为<table>和<td>

release_table <- readHTMLTable("https://www.comichron.com/monthlycomicssales/1997/
                               1997-01.html", header=TRUE, which=2,stringsAsFactors=F)

我希望输出能够反映第二张表中的文本。

Answer 1

我们可以使用rvest来获取所有表。

url <- "https://www.comichron.com/monthlycomicssales/1997/1997-01.html"
library(rvest)
tab <- url %>%  read_html() %>%  html_table()

我认为您正在寻找的是tab[[1]]或tab[[4]]。

R中的Web抓取readHTMLTable错误与功能

1 个答案: