所以我有一个网页抓取项目,其中一个网页在一组<script>
标记内包含JSON格式的所有必要内容。
这是<script>
标签的示例:
<script>
window.postData = {}
window.postData["content"] = [json content]
</script>
我已经使用HtmlAgilityPack来获取特定的<script>
标签,但我不知道如何从中获取json内容。我可以用JSON.net或其他库/框架解析JSON,所以我不担心那部分。我只是坚持只得到Json。是否有一个javascript解析库或我可以使用的东西来获得这个,或者有另一种方法来实现这一点。
非常感谢任何帮助!
答案 0 :(得分:3)
查看jint
var postDataJSON = new Engine()
.Execute("window.postData = {}; window.postData['content'] = [json content]")
.GetValue("window.postData");