基于python和selenium的网页抓取angularjs

时间:2018-06-10 09:03:59

标签: python selenium google-chrome-headless

尝试抓取基于角度的website。我在查找任何元素时收到TimeOutException

WebDriverWait(self.driver, 10).until(EC.presence_of_element_located((By.XPATH, "//div/[contains(@class, 'news--boxes')]")))

尝试了几个html类和标签,但仍然没有运气。有没有一种特定的方法来抓取基于角度的网站,而不是这个?

完整代码:http://collabedit.com/javk4

1 个答案:

答案 0 :(得分:1)

这似乎是XPath中的一个简单错误

只需删除div之后的额外斜杠,如下所示:

"//div[contains(@class, 'news--boxes')]"