rvest
软件包的新手。.我试图提取此处看到的表格,其中包括田径比赛的结果。
https://www.decathlon2000.com/720/gotzis-2000/
简单的rvest
利用率似乎是将网址传递给read_html
,然后使用“ Selectorgadget” js书签选择相关的CSS选择器,然后将其插入到html_nodes
中,完成了。
gotzis2000 <- read_html("https://www.decathlon2000.com/720/gotzis-2000/")
gotzis2000 %>% html_nodes("#articlecontent td")
但是,当我尝试将其发送到html_table
时:
gotzis2000 %>% html_nodes("#articlecontent td") %>% html_table()
我收到错误Error: html_name(x) == "table" is not TRUE
。
当我用html_text
传递上述内容时,我可以看到数据已提取,因此我不确定这里的正确程序是什么。