那里的硒phantomjs thead,但身体遗失

时间:2019-05-05 11:27:56

标签: python-3.x selenium-webdriver phantomjs

在抓取此页面时:

https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI

在Google Chrome浏览器F12中,我看到了xpath

  t//*[@id="equity_future"]

有一个剧院和一个肢体。机身可用。

但是,在python3调试器中,使用

wdriver = webdriver.PhantomJS()
wdriver.get(url)
soup = BeautifulSoup(wdriver.page_source,"lxml")

我确实看到了 thead 个孩子,但 tbody 显示为空

<tbody>
</tbody>

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

如果您提取 page_source ,则仅使用Selenium,可以找到所有的 <tbody> 标签,如下所示:

  • 代码块:

    driver = webdriver.PhantomJS(executable_path=r'C:\WebDrivers\phantomjs.exe')
    driver.get("https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI")
    print(driver.page_source)
    
  • 控制台输出代码段1:

    <tbody>
    <tr>
        <td class="ls">Last Traded</td>
        <td class="vo">Volume</td>
        <td class="oi">Prev.Day Open Interest</td>
    </tr>
    </tbody>
    
  • 控制台输出代码段2:

    <tbody>
    <tr>
        <td class="se">Prev.Day Settlement Price</td>
        <td class="vo">Volume</td>
        <td class="oi">Prev.Day Open Interest</td>
    </tr>
    </tbody>