如何忽略XPATH语句中的br标签?

时间:2018-02-28 07:37:39

标签: xml xpath

需要一个XPATH用于文章文本,它有许多br标签,应该不考虑它并在最后一行之前选择前一行。但在少数情况下,由于额外的br标签,它不起作用。

//div[@id="artText"]/text()[last()-1]

在最后一行之前,有许多br标签,并且在整个网站上不一致。如何忽略br标签?

xml输入是:

<html>
  <head>
    <meta name="generator"
    content="HTML Tidy for HTML5 (experimental) for Windows https://github.com/w3c/tidy-html5/tree/c63cc39" />
    <title></title>
  </head>
  <body>
    <div id='artTt' style='font-size: 12pt; line-height: 150%;' itemprop='articleBody'>
    <br />
    <br />
    <div class='center_image' style='width:90%;' originw='198'>
      <img src='//file.71_1519345637.jpg' border='0' hspace='0' vspace='0' width='100%' alt='???? ?? ???' />
    </div>
    <br />
    <br />
    <br />
    <br />[? ???? &amp; ???? ? ??? ??]</div>
  </body>
</html>

0 个答案:

没有答案