Question

这是查看源代码时网站源代码的样子的一小部分样本：

<script type="application/json+ld">{"@context":"http://schema.org","@graph":[{"@type":"MyArticle","@id":"myID","url":"myURL","date":"2019-06-05T05:09:54+02:00","name":"myName","description":"myDescription"
</script>

我修改了我的代码，如下所示，这似乎行得通，尽管当内容很多时，并不能全部检索。

for (Element scripts : mBlogDocument.getElementsByTag("script").attr("type","application/ld+json")) {

            for (DataNode dataNode : scripts.dataNodes()) {

                if (dataNode.getWholeData().contains("MyArticle")) {

                    Log.d(TAG,dataNode.getWholeData());
                }
            }
        }

所以我有2个问题： A）是否有可靠的方法始终检索内容，无论script标记中的内容有多大使用dataNode.getWholeData（）？和

B）我应该坚持使用Jsoup还是寻求其他方法来检索这种性质的内容？

使用jsoup从网站提取数据以使用JSON-LD生成其内容

0 个答案: