对于一个研究项目,我想在topuniversities.com上建立一个包含大学信息的数据库。我设法编写一些代码来从特定的大学页面中提取信息,这样就可以了。要循环数据库,我需要提取指向主页面上可用的大学页面的链接。在这里,我遇到了问题。由于某些原因,我的代码无法识别链接,尽管我可以使用Chrome中的选择器小工具和检查窗格找到它们。我假设我没有提到正确的节点,但我无法解决问题。
这是我的代码:
url_university_list <- "http://www.topuniversities.com/university-rankings/university-subject-rankings/2015/statistics-operational-research#sorting=rank+region=+country=+faculty=+stars=false+search="
url_university_list %>%
read_html() %>%
html_nodes("a") %>% html_attr("href")
a是选择器小工具标识的节点。当我运行代码时,它会给出一些结果,但不会提供指向大学页面的链接。 想法?