//get source code
String html = new Scanner(new URL("http://example.com/").openStream(), StandardCharsets.UTF_8).useDelimiter("\\A").next();
//parse as jsoup html
Document doc = Jsoup.parse(html);
//find all script elements
Elements scriptElements = doc.getElementsByTag("script");
//all code after here is debug purposes and this is where i need help
for (Element element :scriptElements ){
for (DataNode node : element.dataNodes()) {
System.out.println(node.getWholeData());
System.out.println(element);
}
System.out.println("-------------------");
}
因此,我试图从脚本元素中获取文本并将其解析为JSONObject。附带代码。
问题是,有多个脚本元素,我不知道如何获取其中一个的文本。感谢您的帮助
我已经检查了其他堆栈溢出线程和其他网站是否有任何答案,但是我似乎无法弄清楚。