应用错误收集

我正在为数据分析中的个人项目抓取战士的个人资料页面。但是，有时我不会从我抓取的网站上获取配置文件网址。在那种情况下，我想在Duckduckgo上搜索这个人并使用Rvest包来搜索第一个结果R.我在选择正确的节点时遇到了麻烦。这在大多数网站上都没有问题，但谷歌和Duckduckgo这样的网站不同。

这是我到目前为止的代码。

if (length(f2.url) == 0) tryCatch({
baseurl <- 'https://duckduckgo.com/?q='
query <- fight.details$f2.name[i]
queryurl <- gsub(" ","+", paste0(baseurl, query, "in 
fightmetric.com/fighter-details"))

f2.urla <- read_html(queryurl) %>% 
html_nodes('#r1-0 > div > div.result__extras > div') %>% 
html_text(trim = TRUE) %>% as.character()

我从其他网站选择节点时没有任何问题，但Google和Duckduckgo似乎有所不同。

我怎样才能做到这一点？

刮擦rvest中的duckduckgo的第一个结果

0 个答案: