我已经编写了一些用于在某个网页中搜索特定单词的代码。 但是,我有一些问题,它在网页的javascript部分找到所有关键字,excpet。 我不知道javasrcipt,只有java:| 有人可以帮帮我吗? 感谢。
这是我的代码 -
String searchWord = "WORD";
String url = "SOME URL";
Connection connection = Jsoup.connect(url).userAgent(USER_AGENT);
System.out.println("Searching for the word " + searchWord);
Document htmlDocument = connection.get();
if(htmlDocument.body().text() != null){
if((htmlDocument.body().text()).toLowerCase().contains(searchWord.toLowerCase()))
System.out.println("yes");
else
System.out.println("No");
}
我正在使用Jsoup jar。
答案 0 :(得分:1)
阅读 js 文件并按以下方式处理( Java SE 7 ):
Path source = Paths.get("sourcecode.js");
Charset charset = Charset.forName("US-ASCII");
try(BufferedReader reader = Files.newBufferedReader(source, charset)) {
String line;
while ((line=reader.readLine())!=null) {
if((line).toLowerCase().contains(searchWord.toLowerCase()))
System.out.println("yes");
else
System.out.println("No");
}
} catch (IOException e) {
System.out.println(e.getMessage());
}
答案 1 :(得分:0)
JSoup不是用于解析JavaScript,而是用于HTML。
Rhino是一个更好的选择,它提供了一个'javax.script'变量来解析Javascript。
如果你必须使用JSoup,那么你需要手动解析''节点,使用正则表达式并解析HTML而不是文本,请参阅此链接以获取有关使用JSoup手动解析Javascript的更多信息: