我试图从div中提取文本但排除给定的类:
这就是我正在尝试的:
$pattern = "//div/@title[not(contains (@class, 'second_card local_impact_icon impact-2'))]";
但它不排除给定的类,我只需要提取title =''但只是从第一个div冠军。
这是html:
<div class="match_info"><div title='Yellow Card' class='local_impact_icon impact-1'></div><div title='Red Card' class='second_card local_impact_icon impact-2'></div></div>
答案 0 :(得分:2)
关注XPath
//div/div[not(contains (@class, 'second_card local_impact_icon impact-2'))]/@title
返回
title="Yellow Card"
简化说明 - 只需选择不包含要排除的类的div,并仅检索此div的title属性。当您在位置../@title
处设置此排除时,您已经处于两个div的title-attributes。
问题是如何检索文本 - 在给定的例子中
string(//div/div[not(contains (@class, 'second_card local_impact_icon impact-2'))]/@title)
返回Yellow Card