我正在尝试使用BeautifulSoup4抓取https://understat.com/team/Arsenal/2019(和其他EPL团队页面)以获取所有玩家页面的链接,并最终将这些页面抓取到各个玩家数据,但是由于我不熟悉而被卡住了JSON数据。
我已经尽可能地浏览了我感兴趣的网页部分,但是我当前的输出看起来像这样var playersData = JSON.parse('\x5B\x7B\x22id\x22\x3A\x22318\x22,\x22player_name\x22\x3A\x22Pierre\x2DEmerick\x20Aubameyang\x22,
... ,\x22xGBuildup\x22\x3A\x220\x22\x7D\x5D');
。
我找不到这种格式的有关JSON数据的任何信息,并且想知道是否有人能够帮助我从此页面将数据转换为理想的Pandas DataFrame格式。
答案 0 :(得分:1)
所有这些 int *shared = mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_SHARED, fd1, 0);
序列都是标点字符的十六进制编码,例如\x
,[
和{
,以混淆JSON。 Python在其字符串文字中使用相同的表示法,因此您可以使用"
对其进行解码。
ast.literal_eval()