我使用NodeJS进行网页抓取。
我有一个复杂的HTML字符串。它包含许多html标签和一些jave脚本块。每个javascript块包含带有一些参数的js函数,每个参数都是一个Json字符串。我只对那些Json字符串感兴趣。什么是提取它们的最佳方式?
示例代码:
<html>
<header>...</header>
<script>function1(param1:[{a:"V1"},{b:"v2"}],param2:[{c:"v3"},{d:"v4"}])</script>
<script>...</script>
<body>...</body>
</html>
感谢您的建议。