Question

对于一个研究项目，我想在topuniversities.com上建立一个包含大学信息的数据库。我设法编写一些代码来从特定的大学页面中提取信息，这样就可以了。要循环数据库，我需要提取指向主页面上可用的大学页面的链接。在这里，我遇到了问题。由于某些原因，我的代码无法识别链接，尽管我可以使用Chrome中的选择器小工具和检查窗格找到它们。我假设我没有提到正确的节点，但我无法解决问题。

这是我的代码：

url_university_list <- "http://www.topuniversities.com/university-rankings/university-subject-rankings/2015/statistics-operational-research#sorting=rank+region=+country=+faculty=+stars=false+search="
url_university_list %>%
  read_html() %>%
  html_nodes("a") %>% html_attr("href")

a是选择器小工具标识的节点。当我运行代码时，它会给出一些结果，但不会提供指向大学页面的链接。想法？

rvest返回错误的结果

0 个答案: