HtmlUnit按类名包含字符串

时间:2017-08-13 10:09:04

标签: java url web-scraping htmlunit

我想在HtmlPage中找到任何包含“&date”字样的类的元素。

即我想匹配以下任何一项:

<div class = 'date'> August 13 2017 </div>
<span class = 'pubDate'> August 12 2017 </div>
<div class = 'datePublished'> August 10 2017 </div>

为了完全匹配&#39; date&#39;我使用以下内容:

HtmlPage page;
List<HtmlDivision> date = page.getByXPath("//div[@class='date']");
System.out.println(date.get(0));

哪种方法正常。

但是,如何更改此(或我应该使用什么)以便能够匹配任何具有包含单词date的类名称的元素(不区分大小写)?

1 个答案:

答案 0 :(得分:2)

尝试以下XPath,以匹配包含 div的属性class的所有"date"元素:

//div[contains(@class, 'date')]