html页面的源代码如下所示
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=gb2312">
<script>
document.domain = "xxxx.com";
var jsonObj = {
list: [
{ip: "166.255.255.25", port: 1080, path: "/data/pps.jpeg"}
]
}
var jsParObj = {param1: 25532, param2: 54463}
</script>
</head>
<body>
</body>
</html>
我尝试从该html页面中提取数据并以json格式存储它们。
soup = BeautifulSoup(html_doc, 'html.parser')
script_text = soup.find('script')
使用python库BeautifulSoup4,我得到了这个
<script>
document.domain = "xxxx.com";
var jsonObj = {
list: [
{ip: "166.255.255.25", port: 1080, path: "/data/pps.jpeg"}
]
}
var jsParObj = {param1: 25532, param2: 54463}
</script>
如何删除<script>
标记并将该数据转换为json格式?
另外,我使用python。