使用python

时间:2017-08-30 19:43:34

标签: python json web-scraping python-requests scraper

我正试图在此链接中搜索网站:

https://www.whoscored.com/Players/11119/Show/Lionel-Messi

我想从摘要,防守,攻击性标签中获取数据,我试过了 这样:

import requests
# This is the json data link i wish to get from the defensive tab (from developer tools)
url = "https://www.whoscored.com/StatisticsFeed/1/GetPlayerStatistics?category=summary&subcategory=defensive&statsAccumulationType=0&isCurrent=true&playerId=11119&teamIds=&matchId=&stageId=&tournamentOptions=&sortBy=Rating&sortAscending=&age=&ageComparisonType=&appearances=&appearancesComparisonType=&field=Overall&nationality=&positionOptions=&timeOfTheGameEnd=&timeOfTheGameStart=&isMinApp=false&page=&includeZeroValues=true&numberOfPlayersToPick="

response = requests.get(url)

print(response.json())

我无法管理打印json数据并从选项卡中删除我需要的数据,我做错了什么? 谢谢你的帮助。

1 个答案:

答案 0 :(得分:0)

当按照提供的方式执行代码时,响应将返回403“禁止”状态。

这个提供商可能不希望他们的数据被删除,并检查请求是否有非浏览器访问的迹象,并返回此错误。

在继续操作之前,请务必检查response.status_code