如何使用Jsoup获取帧?

时间:2016-06-26 11:08:12

标签: html jsoup

<html>
    <head></head>
    <frameset cols="180,590,*" border="0">  
        <frame src="test.html" name="main" noresize="" scrolling="no" marginwidth="0" marginheight="0">
        <frame src="http://www.test.com/my.php" name="right" noresize="" scrolling="auto" marginwidth="0" marginheight="0">
            #document    <!-- what is this? -->
                <html>
                    <head>
                        <title>TEST</title>
                    </head>
                    <body></body>
                </html>
        </frame>
    </frameset>
</html>


我正在解析一个网页。但我有一个问题。
什么是#documnet
如何使用<html>解析#document Jsoup以下的paper-tooltip

1 个答案:

答案 0 :(得分:2)

  

如何使用Jsoup在#document下面解析?

您可以将#document视为“虚拟”元素。 Jsoup不会看到它。它既不存在于实际的HTML代码中。

你想要的是用Jsoup获取帧。见下文:

Document doc = ...; // HTML page containing the frameset

Document mainFrameDocument = Jsoup.connect(doc.select("frame[name=main]").absUrl("src")).get();

Document rightFrameDocument = Jsoup.connect(doc.select("frame[name=right]").absUrl("src")).get();