在R中是否有办法列出(查找)给定网页的所有链接? 我想输入一个URL并生成一个包含该站点所有链接的目录树。目的是找到相关的子页面来刮。
这是关于SO的类似问题的链接,但没有R解决方案。感谢。
Link here to similar question on SO
有一个建议的解决方案Linkchecker但是在Python下运行,R中有什么东西吗?
答案 0 :(得分:3)
我认为rvest
可以做你想要的......
library("rvest")
# some url with a bunch of links...
url <- "http://www.drudgereport.com"
url %>% html %>% html_nodes("a") %>% xml_attr("href")