我正在使用XPath从以下URL中提取某些元素:
http://gizmodo.com/how-often-cities-appear-in-books-from-the-past-200-year-1040700553
要提取主要内容,我正在使用查询:
//p[@class='has-media media-640']
但是,我想从这个主要内容中排除所有具有“放大镜lightBox”类的跨度。我查看了StackOverflow并尝试了各种方法,例如:
//div[@class='row post-content']/*[not(self::span[@class='magnifier lightBox'])]
无济于事。