我有这个:
<div class="down_butt_pad1" style="" id="downloadlink"><a href="http://www.link.com" class="down_butt1" onclick="javascript:window.open('http://s.spam.com','popunder','width=800,height=800,scrollbars=yes,status=no,resizable=yes, toolbar=no'); window.focus();"></a></div>
我正在尝试xpath("//div[@id == 'downloadlink']")
但我收到错误(“lxml.etree.XPathEvalError:Invalid expression”)。
我正在做什么有什么问题,我怎样才能搜索具有下载链接的ID而不是?
答案 0 :(得分:4)
您必须在XPath中使用单个=
。您正在寻找的是
"//div[@id='downloadlink']"
然而,div没什么有趣的。为何停在那里?也许您想要提取URL:
"//div[@id='downloadlink']/a/@href"
我建议使用深度挖掘来精确提取您想要的内容,而不是停留在容器元素上,然后再次调用xpath引擎或切换到树型导航。
答案 1 :(得分:1)
我应该
"//div[@id='downloadlink']"