我想从网站上获取html内容 我使用jsoup(java开源)来获取网站并使用此代码获取元素:
Document doc = Jsoup.connect("http://bj.58.com/shangdi/zufang/0/").get();
Elements hrefs = doc.select("*");
Elements hrefs2 = hrefs.select("td:lt(4)");
System.out.println(hrefs2);
我得到了结果:
<td class="tc"><b class="pri">2100</b></td>
<td class="tc">ABCD</td>
<td class="tc">today</td>
或者我编辑这段代码(只需在最后一行添加“text()”):
Elements hrefs2 = hrefs.select("td:lt(4)");
System.out.println(hrefs2.text());
我得到了结果:
2100 ABCD today
但我真的想要实现这样的结果:
2100,ABCD,today
是将逗号添加到结果中的任何方法,以便使用csv文件将结果轻松保存到数据库中。
答案 0 :(得分:2)
您可以Elements
来自hrefs.select
的结果{{1}},此时您可以对列表执行任何操作(例如,根据您的需要对其进行格式化)。
答案 1 :(得分:0)
我使用了tds.append(",");
这为每个数据元素添加了一个逗号,因此它以逗号分隔的方式导入了