Question

在抓取此页面时：

https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI

在Google Chrome浏览器F12中，我看到了xpath

  t//*[@id="equity_future"]

有一个剧院和一个肢体。机身可用。

但是，在python3调试器中，使用

wdriver = webdriver.PhantomJS()
wdriver.get(url)
soup = BeautifulSoup(wdriver.page_source,"lxml")

我确实看到了 thead 个孩子，但 tbody 显示为空

<tbody>
</tbody>

有什么想法吗？

Answer 1

如果您提取 page_source ，则仅使用Selenium，可以找到所有的 <tbody> 标签，如下所示：

代码块：

driver = webdriver.PhantomJS(executable_path=r'C:\WebDrivers\phantomjs.exe')
driver.get("https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI")
print(driver.page_source)

控制台输出代码段1：

<tbody>
<tr>
    <td class="ls">Last Traded</td>
    <td class="vo">Volume</td>
    <td class="oi">Prev.Day Open Interest</td>
</tr>
</tbody>

控制台输出代码段2：

<tbody>
<tr>
    <td class="se">Prev.Day Settlement Price</td>
    <td class="vo">Volume</td>
    <td class="oi">Prev.Day Open Interest</td>
</tr>
</tbody>

那里的硒phantomjs thead，但身体遗失

1 个答案: