我对Jsoup有一些可能很简单的问题
我要解析的页面:
<div id="d4861771" class="q post">
<div class="bar">
<div class="right">
27 kwietnia 2016 08:02
</div>
<a class="qid click" href="/4861771/">#4861771</a>
<a class="click votes rox" rel="nofollow" href="/rox/4861771/">+</a>
<span class=" points">614</span>
<a class="click votes sux" rel="nofollow" href="/sux/4861771/">-</a>
<span class="msg"> </span>
</div>
<div class="quote post-content post-body">
<gadus> te nowe windowsy są do dupy
<br> <gadus> pasjans ma licznik gier
<br> <gadus> to tak jakby wbudowane przypominanie o tym jak bardzo marnujesz czas
</div>
</div>
现在我需要从它的日期,点和变量中的内容,但我不知道如何将它们变成不同的变量。
我的想法来自.text() 然后我有:
27 kwietnia 2016 08:02 #4861771 + 614 - <gadus> te nowe windowsy są do dupy <gadus> pasjans ma licznik gier <gadus> to tak jakby wbudowane przypominanie o tym jak bardzo marnujesz czas
并且只是正则表达,但我认为有更好的主意。
我的输出应如下所示:
Data: 27 kwietnia 2016 08:02
Points: 614
Content: <gadus> te nowe windowsy są do dupy<...>
我明白了!
Elements idd = doc.select("div.q");
for(Element abc : idd){
System.out.println(abc.getElementsByClass("points").text());
System.out.println(abc.getElementsByClass("quote").text());
System.out.println(abc.getElementsByClass("right").text());
}
现在我必须删除这篇文章或者什么?
答案 0 :(得分:0)
您可以这样做:
Document doc = Jsoup......
String data = doc.select(".right").first().text();
String points = doc.select(".points").first().text();
String content = doc.select(".post-content").first().text();
您可能需要添加一些检查以确保select
调用找到一些元素,否则text()
会抛出NullPointerException
。