使用XHR进行Python爬取

时间:2018-10-27 21:54:18

标签: python json web-scraping xmlhttprequest

我是一个新的python,试图抓取彩票网站,并创建一个包含以下信息的文件(彩票号码和开奖号码) 这是链接 https://www.polla.cl/es/view/resultados

我尝试

import requests
from bs4 import BeautifulSoup as soup
url = 'https://www.polla.cl/es/js/1528962859_1cfc1a8930bb080d6ccd5393c1bb2f6d.js'
r = requests.get(url)

print(r.text)

我尝试过https://www.polla.cl/es/view/resultados

但是我得到的结果是html,并且信息隐藏在

您能帮忙获得这些数字吗?

对任何帮助都感激

1 个答案:

答案 0 :(得分:0)

bs4是为HTML / XML设计的,因此,如果将其交给JavaScript,它将不会给您带来不良的结果。这帮助我了解了webscrapping:https://automatetheboringstuff.com/chapter11/