Python + Selenium Chrome webdriver设置为一些抓取工作; lxml库用于解析。我需要一些帮助,因为我无法理解这个问题。我有一个ASP webform,它本质上是围绕查询bottons /菜单等的脚手架。表单填充了一个java脚本呈现表,在几个页面上。页面控件作为表格的最底层<tr>
元素。每帧有十页;上一帧/下一帧通过指向边缘的上一页/下一页的指针进行渲染。 java脚本使用Eventtarget和事件参数字段进行回发
因为分页顺序移动,我使用最外层循环来断言页码。例如,在第一帧(每帧十页)上声明第11页将使视图进入下一帧,并将(Chrome)浏览器转到第11页。
问题:假设最后一页是 n ,现在我断言页面 n + 1 。 Selenium不会抛出404错误。但由于最后一个(第n个)页面仍然驻留在浏览器中,因此数据抓取仍会转储第n页。我不能将停止条件作为显式等待插入,因为DOM完全有效
问题:如果可以,我可以在调用下一页之前拆除最后一个JS呈现的表视图吗?直觉:如果我可以废弃最后一页,我可以使用预期条件来插入停止条件。我已经阅读了很多,但找不到解决办法。任何帮助都会很有用,并表示感谢。