我正在尝试使用python和漂亮的汤4和要求通过网络抓取一个网站。该网站:https://live.alphatiming.co.uk/24hr 这段代码:
import requests
from bs4 import BeautifulSoup
page = requests.get('https://live.alphatiming.co.uk/24hr')
soup = BeautifulSoup(page.text, 'html.parser')
div_all_row = soup.find_all('result_row')
div_which_row = soup.find('row_8640')
print (div_which_row)
当我进入终端时,它什么也没说。我的代码有问题吗?
答案 0 :(得分:0)
您编写的代码可以正确运行,但不能返回results_row,因为<div class="fullwidth fullheight display-type-desktop" id="react"> </div>
div仅在以下代码在HTML检查器中进一步运行时填充。
<script type="text/javascript">
var element = React.createElement(AppLiveResults, {device_type: "desktop" })
ReactDOM.render(element, document.getElementById('react'));
</script>
这意味着当BS4在不运行代码的情况下原始抓取HTML代码时,id="react"
div中不会填充结果。
不幸的是,由于我对Java的了解很少,因此无法进一步帮助您,但是我希望这可以为您提供答案。