我想用jsoup从维基百科中提取出生和死亡日。 例如:
维基百科中的兄弟/死亡日:
* 8. September 1157 in Oxford; † 6. April 1199 in Châlus)
html代码中的出生/死亡日:
* <a href="/wiki/8._September" title="8. September">8. September</a> <a href="/wiki/1157" title="1157">1157</a> in <a href="/wiki/Oxford" title="Oxford">Oxford</a>; † <a href="/wiki/6._April" title="6. April">6. April</a> <a href="/wiki/1199" title="1199">1199</a>
搜索输出:
String birthDate = 8. September 1157;
String deathDate = 6. April 1199;
我的问题是我不知道如何提取信息,因为搜索标签“a”而attr("href")
可能会返回错误的元素,因为如果元素是出生的元素不包含信息或死亡日期或其他日期。