Java-Jsoup-页面中某些脚本元素的getWholeData并将其存储为JSONObject

时间:2018-10-21 04:28:15

标签: java html jsoup

//get source code
    String html = new Scanner(new URL("http://example.com/").openStream(), StandardCharsets.UTF_8).useDelimiter("\\A").next();
    //parse as jsoup html
    Document doc = Jsoup.parse(html);
    //find all script elements
    Elements scriptElements = doc.getElementsByTag("script");
    //all code after here is debug purposes and this is where i need help
    for (Element element :scriptElements ){
        for (DataNode node : element.dataNodes()) {
            System.out.println(node.getWholeData());
            System.out.println(element);
        }
        System.out.println("-------------------");
    }

因此,我试图从脚本元素中获取文本并将其解析为JSONObject。附带代码。

问题是,有多个脚本元素,我不知道如何获取其中一个的文本。感谢您的帮助

我已经检查了其他堆栈溢出线程和其他网站是否有任何答案,但是我似乎无法弄清楚。

0 个答案:

没有答案