如何计算HTML页面中的表数?

时间:2013-10-31 12:01:01

标签: html r web-scraping html-table

我相信包XML有一个解决方案。但是,哪个功能是正确的?

例如: http://en.wikipedia.org/wiki/List_of_deaths_on_eight-thousanders

1 个答案:

答案 0 :(得分:3)

我认为有20张桌子。使用readHTMLTable,您可以提取所有表格:

url <- "http://en.wikipedia.org/wiki/List_of_deaths_on_eight-thousanders"

library(XML)
ll <- readHTMLTable(url)
length(ll)
[1] 20