使用rvest抓取链接(href)时接收NA

时间:2017-04-17 19:48:38

标签: r web screen-scraping rvest

我见过一些类似的问题,但没有一个解决方案适合我。我正在尝试获取每个节点的链接的URL,但list只是空值。

beer <- read_html("https://www.beeradvocate.com/lists/top/")

beerLink <- beer %>% 
html_nodes(".hr_bottom_light a b") %>% 
html_attr('href') %>% 
as.data.frame() 

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

#!/bin/bash for sysdevpath in $(find /sys/bus/usb/devices/usb*/ -name dev); do(syspath="${sysdevpath%/dev}"; devname="$(udevadm info -q name -p $syspath)"; [[ "$devname" == "bus/"* ]]&& continue; eval "$(udevadm info -q property --export -p $syspath)"; [[ -z "$ID_SERIAL" ]] && continue; temporario=${ID_MODEL,,}; if [[ $temporario == *"product_name"* || $temporario == *"company"* ]]; then echo "/dev/$devname"; fi); done; 是后代节点,但b包含您想要的链接。你可以搜索一些后代模式(我只熟悉a版本,看起来你更喜欢CSS),但是这个替代方案可以获得你想要的链接:

xpath

此外,Abraxas是一款令人惊叹的啤酒和桑塔纳专辑

相关问题