我正在尝试使用RSelenium和Rvest软件包来抓取网站:
remDr$navigate("[websiteaddress]")
webElem = remDr$findElement(using = 'name', 'login')
webElem$clearElement()
webElem$sendKeysToElement(list("[username]"))
webElem = remDr$findElement(using = 'name', 'password')
webElem$clearElement()
webElem$sendKeysToElement(list("[secret]"))
$screenshot(display = TRUE)
webElem = remDr$findElement(using = 'class', 'btn')
webElem$clickElement()
我无法走得更远,当我尝试收集所在页面的网址时,确实得到了一个非常奇怪的结果:
> remDr$getCurrentUrl()
$`element-7077-22d3-b52c-4f878433bcbf`
[1] "3a8340b0-d72c-505a-5fa1-8385ef18b5b5"
当然,这与我在浏览器中时显示在网址栏上的实际地址无关。 IT人士将结果的“ 5fa1”部分识别为客户端IP服务器的密钥,该客户端是我要抓取其站点的IP服务器,但我们无法再进行任何操作了。
有人知道这些是什么,我打算如何将它们用于报废吗?实际上,仅此地址的技术名称(?)可能会给我带来很大帮助。