这是查看源代码时网站源代码的样子的一小部分样本:
<script type="application/json+ld">{"@context":"http://schema.org","@graph":[{"@type":"MyArticle","@id":"myID","url":"myURL","date":"2019-06-05T05:09:54+02:00","name":"myName","description":"myDescription"
</script>
我修改了我的代码,如下所示,这似乎行得通,尽管当内容很多时,并不能全部检索。
for (Element scripts : mBlogDocument.getElementsByTag("script").attr("type","application/ld+json")) {
for (DataNode dataNode : scripts.dataNodes()) {
if (dataNode.getWholeData().contains("MyArticle")) {
Log.d(TAG,dataNode.getWholeData());
}
}
}
所以我有2个问题: A)是否有可靠的方法始终检索内容,无论script标记中的内容有多大使用dataNode.getWholeData()?和
B)我应该坚持使用Jsoup还是寻求其他方法来检索这种性质的内容?