我对网络抓取和堆栈溢出完全陌生。我在从表格位于iframe中的网站上抓取信息时遇到麻烦。更令人困惑的是,iframe不是URL。这是一个示例:
查看网站时,我得到:
<iframe src="treeoutagereportpanel ace muni.html">
<head>...</head>
<body class="yui-skin-sam">
<div class="bd">
<div id="outageReportTree">
<table id="ygtvtablee11">...</table>
</div>
</div>
</body>
</iframe>
但是,当我通过JSoup连接到网站并测试连接时,该表在我编写时不会出现:
System.out.println(doc.select("html"));
或
System.out.println(doc.select("iframe"));
(doc是网站的网址)
如果Java无法将该表识别为网站的一部分,我将如何从HTML代码表中提取数据?