使用browser.page_source读取时page_source的内容不会更改

时间:2019-10-05 12:26:09

标签: python-3.x selenium

目标页面网址为“ http://data.eastmoney.com/gzfx/list.html” 此页面底部有一个库存列表表,并且有70多个页面,您可以通过单击下一步(“下一页”)移至其他页面,但是页面的链接永远不会改变,它始终是显示“ http://data.eastmoney.com/gzfx/list.html

我使用硒单击下一页,并使用“ html_code = browser.page_source”获取html的内容,但我从未获得新页面的内容,它始终显示第一页。

我尝试使用“ browser.refresh()”刷新页面,但是它将返回到第一页,第二页与第一页共享相同的链接。

我的问题是我单击下一步按钮后如何获取更新的页面内容。

下面是我的代码:

result

如何获取新页面的更新内容?

谢谢!

1 个答案:

答案 0 :(得分:0)

在Javascript触发内容更新时,页面的源不会更改。

代替获取页面源,请尝试获取body元素的内容。诸如此类(代码未经测试)

html_code = browser.find_element_by_tag_name("body")).text