应用错误收集

Web从html页面抓取所有PDF文件

时间：2018-10-16 06:17:01

标签： r web-scraping

我尝试从html页面下载PDF文件没有成功，以下是我到目前为止可以做的事情：

library(XML)
library(RCurl)

p.html <- htmlParse("http://kenyalaw.org/caselaw/cases/search/")
p.links  <- xpathSApply(p.html, path="//a", xmlGetAttr, "href")
p.urls  <- p.links[grep("*.pdf", p.links)]

我无法列出所有PDF链接。可能是什么问题？

0 个答案:

没有答案