Question

我正在使用PyQt废弃这个网站（下面）。由于某种原因，archive_links.xpath返回前面的/ div标记，但不会返回/ ul标记的任何内容。使用＆＃34;检查＆＃34;在Chrome上我可以看到标签。我在这里缺少什么？

我使用python3.4和PyQt4-4.11.4，如果重要

任何帮助将不胜感激！

from PyQt4.QtGui import *  
from PyQt4.QtCore import *  
from PyQt4.QtWebKit import *  
from lxml import html 

url = r'https://www.seedinvest.com/dstld/series.a.2'

class Render(QWebPage):  
    def __init__(self, url):  
        self.app = QApplication(sys.argv)  
        QWebPage.__init__(self)  
        self.loadFinished.connect(self._loadFinished)  
        self.mainFrame().load(QUrl(url))  
        self.app.exec_()  

    def _loadFinished(self, result):  
        self.frame = self.mainFrame()  
        self.app.quit()  

r = Render(url)  
result = r.frame.toHtml()

archive_links = html.fromstring(str(result.encode('utf-8')))

archive_links.xpath('//*[@id="site-content"]/header/div/div[2]/div[2]/div/ul')

谢谢，

Python - PyQt4，Scaping，无法识别xpath地址

0 个答案: