我想从以下网站复制Red中的文字。我不想要任何HTML代码,因为我可以得到它,但我正在寻找一种方法来简单地复制所有的红色文本。我知道我可以手动完成,但这不是我要找的东西。我真的很感激分享任何代码。
http://www.srigranth.org/servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0
答案 0 :(得分:3)
JSoup允许您阅读网页并迭代其内容元素。
Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();
我不明白该页面上有什么内容,但您看到的文字看起来可能是与a
类dict
链接的内部html。如果是这样的话,
Elements links = doc.select("a.dict");
将为您提供Element
的可迭代集合,您可以轻松地提取文本内容:
for (Element word : links) {
String theTextyoureafter = word.html();
}
这是基本的想法,你可能需要尝试一下才能“恰到好处”,但Jsoup网站上也有很多例子。