我打算分析Google搜索网页中使用的顶级javascript库。
在进行初步分析时,jsoup
似乎是连接google并获取搜索结果的不错选择。
最重要的是,我想转到每个搜索结果URL,以获取所使用的javascript库。
jsoup
是否支持此功能。或者,对于我的用例,我可以在jsoup
顶部使用其他任何库。
注意:我处于分析阶段,还没有开始开发吗?
答案 0 :(得分:0)
如果要使用Jsoup,则必须确保要解析的页面没有被javascript动态修改。因此,有两件事要考虑:
如果要解析许多页面,则结果可能缺少动态加载的库。 Jsoup将发现:
<script src="jquery-3.3.1.min.js"></script>
但是解析起来并不可靠:
<script>
new Element("script", {src: "jquery-3.3.1.min.js", type: "text/javascript"});
</script>
因为这需要执行javascript。