是Element可以解决这个问题的类

时间:2011-11-26 14:46:08

标签: java jsoup

我想从网站上获取html内容 我使用jsoup(java开源)来获取网站并使用此代码获取元素:

 Document doc = Jsoup.connect("http://bj.58.com/shangdi/zufang/0/").get();  
        Elements hrefs = doc.select("*");
        Elements hrefs2 = hrefs.select("td:lt(4)");  
        System.out.println(hrefs2);

我得到了结果:

<td class="tc"><b class="pri">2100</b></td>
<td class="tc">ABCD</td>
<td class="tc">today</td>

或者我编辑这段代码(只需在最后一行添加“text()”):

 Elements hrefs2 = hrefs.select("td:lt(4)");  
 System.out.println(hrefs2.text());

我得到了结果:

 2100 ABCD today 

但我真的想要实现这样的结果:

   2100,ABCD,today 

是将逗号添加到结果中的任何方法,以便使用csv文件将结果轻松保存到数据库中。

2 个答案:

答案 0 :(得分:2)

您可以Elements来自hrefs.select的结果{{1}},此时您可以对列表执行任何操作(例如,根据您的需要对其进行格式化)。

答案 1 :(得分:0)

我使用了tds.append(","); 这为每个数据元素添加了一个逗号,因此它以逗号分隔的方式导入了