Python - PyQt4,Scaping,无法识别xpath地址

时间:2017-09-27 02:20:28

标签: python xpath web-scraping pyqt pyqt4

我正在使用PyQt废弃这个网站(下面)。由于某种原因,archive_links.xpath返回前面的/ div标记,但不会返回/ ul标记的任何内容。使用"检查"在Chrome上我可以看到标签。我在这里缺少什么?

我使用python3.4和PyQt4-4.11.4,如果重要

任何帮助将不胜感激!

from PyQt4.QtGui import *  
from PyQt4.QtCore import *  
from PyQt4.QtWebKit import *  
from lxml import html 

url = r'https://www.seedinvest.com/dstld/series.a.2'

class Render(QWebPage):  
    def __init__(self, url):  
        self.app = QApplication(sys.argv)  
        QWebPage.__init__(self)  
        self.loadFinished.connect(self._loadFinished)  
        self.mainFrame().load(QUrl(url))  
        self.app.exec_()  

    def _loadFinished(self, result):  
        self.frame = self.mainFrame()  
        self.app.quit()  

r = Render(url)  
result = r.frame.toHtml()

archive_links = html.fromstring(str(result.encode('utf-8')))

archive_links.xpath('//*[@id="site-content"]/header/div/div[2]/div[2]/div/ul')

谢谢,

0 个答案:

没有答案