使用JSoup for Java从网页中提取特定行

时间:2013-01-21 21:22:52

标签: java screen-scraping web-scraping jsoup

您好我想使用JSoup库从网站上删除一些文字。我尝试了以下代码,这给了我整个网页,我想提取一个特定的行。这是我正在使用的代码:

Document doc = null;
try {
doc = Jsoup.connect("http://www.example.com").get();
} catch (IOException e) {
e.printStackTrace();
}
String text = doc.html();

System.out.println(text);

打印出以下内容

<html>
 <head></head>
 <body>
  Martin,James,28,London,20k
  <br /> Sarah,Jackson,43,Glasgow,32k
  <br /> Alex,Cook,22,Liverpool,18k
  <br /> Jessica,Adams,34,London,27k
  <br /> 
 </body>
</html>

如何仅提取读取Alex,Cook,22,Liverpool,18k的第6行并将其放入数组中,其中每个元素都是逗号前的单词(例如:[0] = Alex,[1] = Cook等)

0 个答案:

没有答案