Question

我正在尝试使用BeautifulSoup4抓取https://understat.com/team/Arsenal/2019（和其他EPL团队页面）以获取所有玩家页面的链接，并最终将这些页面抓取到各个玩家数据，但是由于我不熟悉而被卡住了JSON数据。

我已经尽可能地浏览了我感兴趣的网页部分，但是我当前的输出看起来像这样var playersData = JSON.parse('\x5B\x7B\x22id\x22\x3A\x22318\x22,\x22player_name\x22\x3A\x22Pierre\x2DEmerick\x20Aubameyang\x22, ... ,\x22xGBuildup\x22\x3A\x220\x22\x7D\x5D');。

我找不到这种格式的有关JSON数据的任何信息，并且想知道是否有人能够帮助我从此页面将数据转换为理想的Pandas DataFrame格式。

Answer 1

所有这些int *shared = mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_SHARED, fd1, 0);序列都是标点字符的十六进制编码，例如\x，[和{，以混淆JSON。 Python在其字符串文字中使用相同的表示法，因此您可以使用"对其进行解码。

ast.literal_eval()

抓取JSON数据

1 个答案: