我正在为数据分析中的个人项目抓取战士的个人资料页面。但是,有时我不会从我抓取的网站上获取配置文件网址。在那种情况下,我想在Duckduckgo上搜索这个人并使用Rvest包来搜索第一个结果R.我在选择正确的节点时遇到了麻烦。这在大多数网站上都没有问题,但谷歌和Duckduckgo这样的网站不同。
这是我到目前为止的代码。
if (length(f2.url) == 0) tryCatch({
baseurl <- 'https://duckduckgo.com/?q='
query <- fight.details$f2.name[i]
queryurl <- gsub(" ","+", paste0(baseurl, query, "in
fightmetric.com/fighter-details"))
f2.urla <- read_html(queryurl) %>%
html_nodes('#r1-0 > div > div.result__extras > div') %>%
html_text(trim = TRUE) %>% as.character()
我从其他网站选择节点时没有任何问题,但Google和Duckduckgo似乎有所不同。
我怎样才能做到这一点?