复制网站Java中的选定文本

时间:2014-01-20 00:40:31

标签: java web copy

我想从以下网站复制Red中的文字。我不想要任何HTML代码,因为我可以得到它,但我正在寻找一种方法来简单地复制所有的红色文本。我知道我可以手动完成,但这不是我要找的东西。我真的很感激分享任何代码。

http://www.srigranth.org/servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0

1 个答案:

答案 0 :(得分:3)

JSoup允许您阅读网页并迭代其内容元素。

Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();

我不明白该页面上有什么内容,但您看到的文字看起来可能是与adict链接的内部html。如果是这样的话,

Elements links = doc.select("a.dict");

将为您提供Element的可迭代集合,您可以轻松地提取文本内容:

for (Element word : links) {
    String theTextyoureafter = word.html();
}

这是基本的想法,你可能需要尝试一下才能“恰到好处”,但Jsoup网站上也有很多例子。