我无法使用xpath和lxml库解析html

时间:2016-10-16 10:39:36

标签: python python-3.x parsing xpath lxml

我正在使用Python 3.5。 我希望在XPATH的帮助下从网站获得一个同义词列表,但是我没有得到所需的html代码并得到“[]”。

import lxml.html
word=input("Input your word: ")
url = "http://www.thesaurus.com/browse/{word}?s=t.html".format(word=word)
html = lxml.html.parse(url)
syn = html.xpath("//DIV[@id='filters-0']")
print(syn)

如果你擅长python,请告诉我如何更简洁明了地完成这项任务。 非常感谢!

2 个答案:

答案 0 :(得分:0)

xpath语法区分大小写:

syn = html.xpath("//div[@id='filters-0']")
print(syn)

答案 1 :(得分:-1)

想象你需要提取同义词:

import requests
from lxml import html

source = html.fromstring(((requests.get('http://www.thesaurus.com/browse/wordy?s=t.html')).text).encode('utf-8'))
print (source.xpath('//div[@class="synonym-description"]//text()')[3].strip())