<html>
<head></head>
<frameset cols="180,590,*" border="0">
<frame src="test.html" name="main" noresize="" scrolling="no" marginwidth="0" marginheight="0">
<frame src="http://www.test.com/my.php" name="right" noresize="" scrolling="auto" marginwidth="0" marginheight="0">
#document <!-- what is this? -->
<html>
<head>
<title>TEST</title>
</head>
<body></body>
</html>
</frame>
</frameset>
</html>
我正在解析一个网页。但我有一个问题。
什么是#documnet
?
如何使用<html>
解析#document
Jsoup
以下的paper-tooltip
?
答案 0 :(得分:2)
如何使用Jsoup在#document下面解析?
您可以将#document
视为“虚拟”元素。 Jsoup不会看到它。它既不存在于实际的HTML代码中。
你想要的是用Jsoup获取帧。见下文:
Document doc = ...; // HTML page containing the frameset
Document mainFrameDocument = Jsoup.connect(doc.select("frame[name=main]").absUrl("src")).get();
Document rightFrameDocument = Jsoup.connect(doc.select("frame[name=right]").absUrl("src")).get();