此问题不可重复,因为将用户代理添加到标头无法解决任何问题。
我一直在尝试从此URL获得答复。这是XML Feed,而不是HTML文件。这是一个实时供稿,它是从cashpoint.com的live soccer page开始每秒更新的。我可以从上一个提到的页面中获取HTML页面,但是从第一个提到的URL中我无法检索XML数据。我可以用Google Chrome浏览器检查它,然后看到响应就可以了。但是它返回b''。尝试获取和发布。
编辑:试图添加更多标题,但仍然无法正常工作。
如果检查员可以看到,是否有可能检索此信息?
下面是我的代码和一些图片(如果您太忙无法查看链接)。
import requests
class GetFeed():
def __init__(self):
pass
def live_odds(self):
live_index_page = 'https://www.cashpoint.dk/en/live/index.html'
live_oddsupdate = 'https://www.cashpoint.dk/index.php?r=games/oddsupdate'
r = requests.get(live_oddsupdate)
print(r.text)
feed = GetFeed()
feed.live_odds()
答案 0 :(得分:3)
其中之一,在Chrome控制台中,您可以看到这是一个POST请求,并且您似乎正在用Python代码执行GET请求。
答案 1 :(得分:0)
您需要在发布请求中包含一些数据和一些标头。试试这个:
url = 'https://www.cashpoint.dk/index.php?r=games/oddsupdate'
headers = {
"X-Requested-With": "XMLHttpRequest",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
"Content-Type": "application/x-www-form-urlencoded",
"Cookie": "_ga=GA1.2.517291307.1531264976; _gid=GA1.2.1421702183.1531264976; _pk_id.155.9810=7984b0a0e139caba.1531264979.1.1531264979.1531264979.; cookieConsent=1; cpLanguage=en; langid=2; ad_network=DIRECT; PHPSESSID=f4mbbfd8adb3m59gfc1pelo126"
}
data = "parameters%5Baction%5D=odds_update¶meters%5Bgame_category%5D=live¶meters%5Bsport_id%5D=¶meters%5Btimestamp%5D=1531268162¶meters%5Bgameids%5D=%5B905814%2C905813%2C905815%2C905818%2C905792%5D&formToken=c3fed3ea6b46dae171a6f1a6d21db14fcc21474c"
response = requests.post(url, data=data, headers=headers)
print response.content
只需测试一下就可以了。这里的要点是,所有这些信息都可以在与Google chrome完全相同的xhr网络检查中找到。下次,在发布问题之前,请先阅读xmlhttprequests。