使用jsoup从网站提取数据以使用JSON-LD生成其内容

时间:2019-06-13 21:16:51

标签: java android json jsoup

这是查看源代码时网站源代码的样子的一小部分样本:

<script type="application/json+ld">{"@context":"http://schema.org","@graph":[{"@type":"MyArticle","@id":"myID","url":"myURL","date":"2019-06-05T05:09:54+02:00","name":"myName","description":"myDescription"
</script>

我修改了我的代码,如下所示,这似乎行得通,尽管当内容很多时,并不能全部检索。

for (Element scripts : mBlogDocument.getElementsByTag("script").attr("type","application/ld+json")) {

            for (DataNode dataNode : scripts.dataNodes()) {

                if (dataNode.getWholeData().contains("MyArticle")) {

                    Log.d(TAG,dataNode.getWholeData());
                }
            }
        }

所以我有2个问题: A)是否有可靠的方法始终检索内容,无论script标记中的内容有多大使用dataNode.getWholeData()?和

B)我应该坚持使用Jsoup还是寻求其他方法来检索这种性质的内容?

0 个答案:

没有答案