Question

我正在尝试使用python和漂亮的汤4和要求通过网络抓取一个网站。该网站：https://live.alphatiming.co.uk/24hr 这段代码：

import requests
from bs4 import BeautifulSoup
page = requests.get('https://live.alphatiming.co.uk/24hr')
soup = BeautifulSoup(page.text, 'html.parser')

div_all_row = soup.find_all('result_row')
div_which_row = soup.find('row_8640')

print (div_which_row)

当我进入终端时，它什么也没说。我的代码有问题吗？

Answer 1

您编写的代码可以正确运行，但不能返回results_row，因为<div class="fullwidth fullheight display-type-desktop" id="react"> </div> div仅在以下代码在HTML检查器中进一步运行时填充。

<script type="text/javascript">
  var element = React.createElement(AppLiveResults, {device_type: "desktop" })
  ReactDOM.render(element, document.getElementById('react'));
</script>

这意味着当BS4在不运行代码的情况下原始抓取HTML代码时，id="react" div中不会填充结果。

不幸的是，由于我对Java的了解很少，因此无法进一步帮助您，但是我希望这可以为您提供答案。

为什么终端什么都不显示？

1 个答案: