更新时钟刮擦

时间:2017-07-07 07:56:35

标签: python r xpath web-scraping

我试图从网站上搜集一些数据。我似乎无法在此页面上删除日期(时钟),因为(我认为)它会通过函数不断更新,而xpath似乎无法正常工作。

相关网页是: http://www.tariffa.it/adsl/infostrada-easy-internet/ 我尝试刮擦的元素的xpath是: // * [(@ id =" clock")]

我试图在R和Python中这样做,但都不起作用。如果您对如何获取这些数据有一些建议,我将永远感激。

感谢。 (我将发布在R中使用的代码,我知道它可以正常工作,因为其余的数据正在被删除)

url = "http://www.tariffa.it/adsl/infostrada-easy-internet/"
doc1 <- htmlParse(url)
exp_date <- xpathSApply(doc1, '//*[(@id = "clock")]', saveXML)

0 个答案:

没有答案