我想解析用GWT编写的HTML页面的内容。我尝试使用Jericho HTML内容解析器解析它,但问题是页面源没有内容。在对GWT页面进行一些研究之后,我开始知道GWT页面是用JAVA编写的,而GWT编译器从java代码创建了一个复杂的js页面结构,以在浏览器上显示HTML内容。
有没有办法可以解析这些类型的页面?
答案 0 :(得分:1)
如果代码是在OBF - Obfuscated mode
中编译的(代码通常在此模式下编译以供生产使用),那将非常困难,因为创建的JS
文件是非人类可读的。
这个link可能有助于您更好地理解GWT编译器。
修改强>:
Here you go。这可能也会有所帮助。这里提到了如何De-obfuscate the Javascript
。
<强> EDIT2 强>:
GWT-Penetration-Testing-Toolset - 检查此工具。
答案 1 :(得分:1)