我试图从网站上搜集一些数据。我似乎无法在此页面上删除日期(时钟),因为(我认为)它会通过函数不断更新,而xpath似乎无法正常工作。
相关网页是: http://www.tariffa.it/adsl/infostrada-easy-internet/ 我尝试刮擦的元素的xpath是: // * [(@ id =" clock")]
我试图在R和Python中这样做,但都不起作用。如果您对如何获取这些数据有一些建议,我将永远感激。
感谢。 (我将发布在R中使用的代码,我知道它可以正常工作,因为其余的数据正在被删除)
url = "http://www.tariffa.it/adsl/infostrada-easy-internet/"
doc1 <- htmlParse(url)
exp_date <- xpathSApply(doc1, '//*[(@id = "clock")]', saveXML)