使用R-selenium从aspx网页中抓取数据

时间:2016-07-19 06:28:19

标签: html asp.net r selenium

我对r和selenium很新,所以希望我可以清楚地表达自己的问题。 我想从网站(.aspx)中删除一些数据,我需要输入一些化学代码,以便能够在下一页中提取一些信息(使用R-selenium输入和点击元素)。到目前为止,我已经能够构建一个简短的代码,让我完成第一步,即拉出我想要的正确页面。但是我在找到一个很好的方法来从这个网站上删除数据(表中的化学信息)时遇到了很多麻烦。主要是因为网站不会分配新的HTML地址,而不是给我任何化学搜索的相同的aspx地址。我打算克服这个问题,然后建立一个循环,这样我就可以自动获取更多信息。任何人都有任何好的想法,我应该如何在click-element后关闭数据?我需要第二页的化学信息表。 非常感谢大家!

在这里,我把我写的代码写到目前为止:我需要的下一步是将表格刮到下一页!

library("RSelenium")
checkForServer()
startServer()
mybrowser <- remoteDriver()
mybrowser$open()
mybrowser$navigate("http://limitvalue.ifa.dguv.de/")
mybrowser$findElement(using = 'css selector', "#Tbox_cas")
wxbox <- mybrowser$findElement(using = 'css selector', "#Tbox_cas")
wxbox$sendKeysToElement(list("64-19-7"))
wxbutton <- mybrowser$findElement(using = 'css selector', "#Butsearch")
wxbutton$clickElement()

1 个答案:

答案 0 :(得分:0)

首先,您的工具选择是错误的。

其次,在你的情况下

  1. 发布到“永久”网址
  2. 302重定向到新网址,在您的情况下为http://limitvalue.ifa.dguv.de/WebForm_ueliste2.aspx
  3. 获取新网址
  4. 第三,你追求的最终产出是什么?

    这实际上取决于您要处理的数据量。否则做一个手动任务。