如何从Jsoup解析器库中提取数据?

时间:2013-12-09 08:51:04

标签: java parsing html-parsing jsoup

大家好我正在尝试从网址中提取数据。 这是我的简单代码:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class GetProxyServer {
public static void main(String args[]) throws Exception {

    String url = "http://proxy.dongsuya.net/proxy_speed.php";
    Document doc = Jsoup.connect(url).get();
    Element proxyTable = doc.getElementById("proxy_table");
    Elements proxies_tds = proxyTable.select("td:contains(:)"); 
    System.out.println(proxies_tds);
    }
}

现在我可以从控制台看到:

<td class="col_B">110.4.12.170:81</td>
<td class="col_B">202.171.253.83:84</td>
<td class="col_A">y094228.ppp.asahi-net.or.jp:80</td>...
问题是,我无法提取内部数据。我只想带“110.4.12.170:81”。 我试试这个:

for (Element proxies_td : proxies_tds){
        String onlyData = proxies_tds.text();
    }

但我无法显示控制变量“onlyData”。 我怎样才能做到这一点?而且,如何将数据逐个保存到String?

1 个答案:

答案 0 :(得分:0)

仔细查看for循环中的语句:String onlyData = proxies_tds.text();尝试将proxies_tds更改为proxies_td;,您希望将text()应用于每个单独的单元格。 -Credits to MCL