用python解析html页面中的json

时间:2016-10-15 09:55:04

标签: python html json

html页面的源代码如下所示

<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=gb2312">
<script>
    document.domain = "xxxx.com";
    var jsonObj = {
        list: [
            {ip: "166.255.255.25", port: 1080, path: "/data/pps.jpeg"}
        ]
    }
    var jsParObj = {param1: 25532, param2: 54463}
</script>
</head>
<body>
</body>
</html>

我尝试从该html页面中提取数据并以json格式存储它们。

soup = BeautifulSoup(html_doc, 'html.parser')
script_text = soup.find('script')

使用python库BeautifulSoup4,我得到了这个

<script>
    document.domain = "xxxx.com";
    var jsonObj = {
        list: [
            {ip: "166.255.255.25", port: 1080, path: "/data/pps.jpeg"}
        ]
    }
    var jsParObj = {param1: 25532, param2: 54463}
</script>

如何删除<script>标记并将该数据转换为json格式? 另外,我使用python。

0 个答案:

没有答案