用jsoup从维基百科中提取出生/死亡日?

时间:2017-01-12 15:51:06

标签: parsing jsoup

我想用jsoup从维基百科中提取出生和死亡日。 例如:

维基百科中的兄弟/死亡日:

* 8. September 1157 in Oxford; † 6. April 1199 in Châlus)

html代码中的出生/死亡日:

* <a href="/wiki/8._September" title="8. September">8. September</a> <a href="/wiki/1157" title="1157">1157</a> in <a href="/wiki/Oxford" title="Oxford">Oxford</a>; † <a href="/wiki/6._April" title="6. April">6. April</a> <a href="/wiki/1199" title="1199">1199</a>

搜索输出:

String birthDate = 8. September 1157;
String deathDate = 6. April 1199;

我的问题是我不知道如何提取信息,因为搜索标签“a”而attr("href")可能会返回错误的元素,因为如果元素是出生的元素不包含信息或死亡日期或其他日期。

0 个答案:

没有答案