无法创建准确的xpath来查找项目

时间:2018-03-25 09:34:43

标签: xpath web-scraping

我很难创建适当的xpath,以便从以下元素中找到Title:Genre:

Html元素:

<div class="mdif">
    <ul>
        <li><b>Title:</b>Army Of Darkness</li> 
        <li><b>Genre:</b></li> Horror
    </ul>
</div>

输出我想:

Army Of Darkness
Horror

我已尝试使用下面的Army Of Darkness获得成功。我不知道这是否是最准确的一个:

root.xpath("//div[@class='mdif']//li/text()")[0]

然而,如果获得Horror,我会陷入困境。使用上述元素中的xpath获得Horror的任何帮助都将受到高度赞赏。

1 个答案:

答案 0 :(得分:1)

尝试以下XPath并在出现任何问题时通知我们:

//div[@class='mdif']//ul//text()[normalize-space() and not(parent::b)]

normalize-space()谓词应该丢弃仅包含空格字符的文本节点,而not(parent::b)谓词应该允许您忽略"Title:""Genre:"个节点