Question

尝试从乌克兰语在线词典中检索数据一切正常：

url= "http://www.toponymic-dictionary.in.ua/index.phpoption=com_content&view=section&layout=blog&id=8&Itemid=9"
page = urllib.request.urlopen(url)
pageWritten = page.read()
pageReady = pageWritten.decode('utf-8')
xmldata = lxml.html.document_fromstring(pageReady)
text1 = xmldata.xpath('//p[@class="MsoNormal"]//text()')

但是没有其他链接可以解决：

from urllib.parse import urlparse, parse_qs, urlencode

url = 'http://sum.in.ua/?swrd=автор'
parsed_url = urlparse(url)
parameters = parse_qs(parsed_url.query)
url = parsed_url._replace(query=urlencode(parameters)).geturl()
page = urllib.request.urlopen(url)

pageWritten = page.read()
pageReady = pageWritten.decode('utf-8')
xmldata = lxml.html.document_fromstring(pageReady)
text1 = xmldata.xpath('//div[@itemprop="articleBody"]')

它给我一个空列表。 Xpath很好，而我在Chrome中使用Xpath Helper进行了双重检查。

有什么想法吗？

Python 3.4.0 - xpath - 获取空列表

0 个答案: