我想从此页面中提取txt文件的所有下载链接:https://www.bundestag.de/dokumente/protokolle/plenarprotokolle/plenarprotokolle。为此,我尝试了SelectorGadget并选择了以下内容:
有了这些信息,我写了这段代码:
library(rvest)
library(tidyverse)
protokolle <-
read_html("https://www.bundestag.de/dokumente/protokolle/plenarprotokolle/plenarprotokolle")
txts <-
protokolle %>%
html_nodes(".bt-link-dokument")
如果我尝试
,结果是一样的txts <-
protokolle %>%
html_nodes(xpath = '//*[contains(concat( " ", @class, " " ), concat( " ", "bt-link-dokument", " " ))]')
由于我不理解的原因,txts
仅包含{xml_nodeset (0)}
。关于出了什么问题的任何想法?