R内的链接检查器

时间:2015-05-14 10:15:04

标签: r web-scraping

在R中是否有办法列出(查找)给定网页的所有链接? 我想输入一个URL并生成一个包含该站点所有链接的目录树。目的是找到相关的子页面来刮。

这是关于SO的类似问题的链接,但没有R解决方案。感谢。

Link here to similar question on SO

有一个建议的解决方案Linkchecker但是在Python下运行,R中有什么东西吗?

1 个答案:

答案 0 :(得分:3)

我认为rvest可以做你想要的......

library("rvest")
# some url with a bunch of links...
url <- "http://www.drudgereport.com"
url %>% html %>% html_nodes("a") %>% xml_attr("href")