使用beautifulsoup从<script>提取数据

时间:2018-11-30 19:40:49

标签: python beautifulsoup

我正在尝试使用Python和Beautifulsoup抓取一些数据。我知道如何从脚本标签获取文本。 []之间的数据是有效的json。

  
 

我已经阅读了此回复,它几乎可以满足我的要求: 用BeautifulSoup提取

这是我的代码:

 导入urllib.request
从bs4导入BeautifulSoup
导入json

url =“ www.example.com”
html = urllib.request.urlopen(url)
汤= BeautifulSoup(html,“ html.parser”)
raw_data = soup.find(“ script”)
 

然后我会理想地这样做:

  json_dict = json.loads(原始数据)
 

并通过字典访问数据。但这由于

而不起作用