在网页中搜索keyworkd

时间:2016-08-06 17:50:02

标签: javascript java

我已经编写了一些用于在某个网页中搜索特定单词的代码。 但是,我有一些问题,它在网页的javascript部分找到所有关键字,excpet。 我不知道javasrcipt,只有java:| 有人可以帮帮我吗? 感谢。

这是我的代码 -

String searchWord = "WORD";
    String url = "SOME URL";

    Connection connection = Jsoup.connect(url).userAgent(USER_AGENT);
    System.out.println("Searching for the word " + searchWord);
    Document htmlDocument = connection.get();

    if(htmlDocument.body().text() != null){
                if((htmlDocument.body().text()).toLowerCase().contains(searchWord.toLowerCase()))
                    System.out.println("yes");
                else
                    System.out.println("No");

                                            }

我正在使用Jsoup jar。

2 个答案:

答案 0 :(得分:1)

阅读 js 文件并按以下方式处理( Java SE 7 ):

    Path source = Paths.get("sourcecode.js");   

    Charset charset = Charset.forName("US-ASCII");

    try(BufferedReader reader = Files.newBufferedReader(source, charset)) {
        String line;
        while ((line=reader.readLine())!=null) {
            if((line).toLowerCase().contains(searchWord.toLowerCase()))
                System.out.println("yes");
            else
                System.out.println("No");
        }
    } catch (IOException e) {
        System.out.println(e.getMessage());
    }

答案 1 :(得分:0)

JSoup不是用于解析JavaScript,而是用于HTML。

Rhino是一个更好的选择,它提供了一个'javax.script'变量来解析Javascript。

如果你必须使用JSoup,那么你需要手动解析''节点,使用正则表达式并解析HTML而不是文本,请参阅此链接以获取有关使用JSoup手动解析Javascript的更多信息:

Parse JavaScript with jsoup