我正在尝试使用java中的Jsoup从网页中获取元素及其各自的属性。但是,我已经意识到有一些javascript在页面加载后运行,它创建了一个表,其中包含我试图在页面上访问的所有信息。
使用java,我想知道在执行javascript之后是否有任何方法可以访问更新的HTML源代码,以便我可以获取表格中我需要的元素。
提前致谢。
答案 0 :(得分:0)
jsoup不支持javascript执行,你必须使用其他东西加载页面,获取源代码然后将其传递给jsoup来解析你想要的信息。
我在这种情况下使用的几个库:
还有其他一些,但这些是我使用的两个,并且感觉很舒服。
糟糕,只是做了一些谷歌搜索,似乎这是一个非常相似的question
另请参阅此list of headless browsers。很好的答案,我有这个书签。