我使用XPath抓取内容。我需要抓取的是div
中给定id
的内容。在div
的内部还有另一个div
,我不想抓内容。
我使用以下XPath:
//[@id='Main'][not(contains(div/@id, 'orderform'))]
但是使用这个XPath我不是像所期望的那样从所有网址中提取,而是从那些网址中提取div id="Main"
并且内部没有div id="orderform"
。
我应该使用什么XPath代替整个div id="Main"
,但不包括div id="orderform"
的内容?
答案 0 :(得分:2)
//*[@id='Main']//*[not(div[@id="orderform"])]
div
标记是子标记,您应该降低级别。
//*[@id='Main']/*[not(div[@id="orderform"])]