Web从html页面抓取所有PDF文件

时间:2018-10-16 06:17:01

标签: r web-scraping

我尝试从html页面下载PDF文件没有成功,以下是我到目前为止可以做的事情:

library(XML)
library(RCurl)

p.html <- htmlParse("http://kenyalaw.org/caselaw/cases/search/")
p.links  <- xpathSApply(p.html, path="//a", xmlGetAttr, "href")
p.urls  <- p.links[grep("*.pdf", p.links)]

我无法列出所有PDF链接。可能是什么问题?

0 个答案:

没有答案