Question

我正在尝试使用RSelenium和Rvest软件包来抓取网站：

remDr$navigate("[websiteaddress]")
webElem = remDr$findElement(using = 'name', 'login')
webElem$clearElement()
webElem$sendKeysToElement(list("[username]"))
webElem = remDr$findElement(using = 'name', 'password')
webElem$clearElement()
webElem$sendKeysToElement(list("[secret]"))
$screenshot(display = TRUE)
webElem = remDr$findElement(using = 'class', 'btn')
webElem$clickElement()

我无法走得更远，当我尝试收集所在页面的网址时，确实得到了一个非常奇怪的结果：

> remDr$getCurrentUrl()
$`element-7077-22d3-b52c-4f878433bcbf`
[1] "3a8340b0-d72c-505a-5fa1-8385ef18b5b5"

当然，这与我在浏览器中时显示在网址栏上的实际地址无关。 IT人士将结果的“ 5fa1”部分识别为客户端IP服务器的密钥，该客户端是我要抓取其站点的IP服务器，但我们无法再进行任何操作了。

有人知道这些是什么，我打算如何将它们用于报废吗？实际上，仅此地址的技术名称（？）可能会给我带来很大帮助。

网址抓取导致无法识别的结果

0 个答案: