我正在编写一个需要从网页中提取链接的程序(用Java编写)。我正在使用htmlParser(http://htmlparser.sourceforge.net/),但我只能提取html链接(用<a href="...">
定义)并且我不知道如何处理javascript代码以从...中提取链接你帮我??
答案 0 :(得分:2)
您可以将Rhino与DOM environment, written in JavaScript一起使用 顺便说一下,它是John Resig写的。
答案 1 :(得分:0)
来自sourceforge的HTML解析器非常有用。我已经用它来解析一大堆HTML了。但是,解析JS是不同的。欢呼声。
答案 2 :(得分:0)
这可能是最全面的工具。 Rhino 。你想做的一切都可以用Rhino完成。