大家好我正在尝试从网址中提取数据。 这是我的简单代码:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class GetProxyServer {
public static void main(String args[]) throws Exception {
String url = "http://proxy.dongsuya.net/proxy_speed.php";
Document doc = Jsoup.connect(url).get();
Element proxyTable = doc.getElementById("proxy_table");
Elements proxies_tds = proxyTable.select("td:contains(:)");
System.out.println(proxies_tds);
}
}
现在我可以从控制台看到:
<td class="col_B">110.4.12.170:81</td>
<td class="col_B">202.171.253.83:84</td>
<td class="col_A">y094228.ppp.asahi-net.or.jp:80</td>...
问题是,我无法提取内部数据。我只想带“110.4.12.170:81”。
我试试这个:
for (Element proxies_td : proxies_tds){
String onlyData = proxies_tds.text();
}
但我无法显示控制变量“onlyData”。 我怎样才能做到这一点?而且,如何将数据逐个保存到String?
答案 0 :(得分:0)
仔细查看for循环中的语句:String onlyData = proxies_tds.text();
尝试将proxies_tds
更改为proxies_td;
,您希望将text()应用于每个单独的单元格。 -Credits to MCL