我已经阅读了很多关于此的帖子,但到目前为止我找不到解决方案。也许我太笨了,在这种情况下,请指出它,同时对我很好:D
这是我在这里发布的第一个问题,所以反正很好:D
我的问题是,我使用selenium打开一些网站并点击一些按钮。之后,我获取页面源并使用jsoup解析它我需要的一些内容。这工作,但有页面,我没有得到当前的dom,但页面源,因为它是由服务器首先发送的。我可以点击javascripts添加的东西,所以selenium知道他们在那里。但我无法获得整个当前的HTML代码。所以基本上,我的问题是:
当我右键单击页面并单击查看页面源时,我如何获得selenium显示的内容?因为我看到的东西与我执行getpagesource()方法时得到的不同。
人们回答了一些问题:我必须等待,我必须自己执行javascript等... 但这并不能帮助我说实话。按钮就在那里(因为javascript已经添加了它),我可以用selenium导航并点击它。当我加载pagesource,它不在那里。与等待相同,已经处理的javascript,生成的html代码已经在他的位置。当我混淆了一些东西时,请耐心等待。我不是一个Web开发人员,我刚刚开始研究一个项目,现在我陷入困境。我学会了如何使用jsoup,我认识到我需要使用selenium(顺便说一句,我使用firefoxdriver。它足够快我的目的,我喜欢看我执行代码时会发生什么),我读到了关于javascript但是现在我真的没有有一个线索如何继续。
我没有添加任何代码,因为基本上我只使用简单的已知方法来获取页面,单击某些按钮并获取pagesource。如果有帮助,我可以添加代码。
提前致谢