在抓取此页面时:
在Google Chrome浏览器F12中,我看到了xpath
t//*[@id="equity_future"]
有一个剧院和一个肢体。机身可用。
但是,在python3调试器中,使用
wdriver = webdriver.PhantomJS()
wdriver.get(url)
soup = BeautifulSoup(wdriver.page_source,"lxml")
我确实看到了 thead 个孩子,但 tbody 显示为空
<tbody>
</tbody>
有什么想法吗?
答案 0 :(得分:0)
如果您提取 page_source
,则仅使用Selenium,可以找到所有的 <tbody>
标签,如下所示:
代码块:
driver = webdriver.PhantomJS(executable_path=r'C:\WebDrivers\phantomjs.exe')
driver.get("https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI")
print(driver.page_source)
控制台输出代码段1:
<tbody>
<tr>
<td class="ls">Last Traded</td>
<td class="vo">Volume</td>
<td class="oi">Prev.Day Open Interest</td>
</tr>
</tbody>
控制台输出代码段2:
<tbody>
<tr>
<td class="se">Prev.Day Settlement Price</td>
<td class="vo">Volume</td>
<td class="oi">Prev.Day Open Interest</td>
</tr>
</tbody>