xpath:仅提取以。开头的类

时间:2018-05-17 03:52:15

标签: html r xml xpath

我有一个看起来像的HTML:

<div class="date_s">May 16, 2018</div>
<div class="date_a">May 17, 2018</div>
<div class="date_g23">May 18, 2018</div>

我可以使用以下内容提取特定的div类:

XML::xpathSApply(XML::htmlParse(myurl), "//div[@class='date_s']", XML::saveXML)

如何提取所有以'date'开头的div类?

我徒劳无功(返回一个空列表):

XML::xpathSApply(XML::htmlParse(myurl), "//div[starts-with(name(), 'date')]", XML::saveXML)

2 个答案:

答案 0 :(得分:2)

您的代码基本上是正确的,只需使用@class代替name()

XML::xpathSApply(XML::htmlParse(myurl), 
                 "//div[starts-with(@class, 'date')]", XML::saveXML)

[1] "<div class=\"date_s\">May 16, 2018</div>"  
[2] "<div class=\"date_a\">May 17, 2018</div>"  
[3] "<div class=\"date_g23\">May 18, 2018</div>"

答案 1 :(得分:0)

您可以通过

获取完整列表
document.querySelectorAll("div[class^='date']" );