Question

我只想从下面的代码中获取文本 updated page title

<h2 class="cmp-title__text" xpath="1">
            updated page title
        <span class="gmt_style" aria-hidden="true">Tue, 20 Jul 2021 13:19:22 GMT</span></h2>

我尝试了下面的一个，但它也从 span 标签中获取文本，即 Tue , 20 Jul 2021 13:!9:22 GMT。

var pgTitle=element(by.xpath("//h2[@class='cmp-title__text']"));
var pgTitleFromApp = await translatedPgTitle.getText();

输出：

+updated page title
+Tue, 20 Jul 2021 14:02:35 GMT

请帮忙解决这个问题！

Answer 1

根据此 html 片段获取 text 节点的 Xpath：

<h2 class="cmp-title__text">
        updated page title
    <span>Tue, 20 Jul 2021 13:19:22 GMT</span>
    
    second text
    
    <span>Tue, 20 Jul 2021 13:19:22 GMT</span>
    
    third text
    
</h2>

可以使用此 xpath 访问第一个文本节点

//h2[@class='cmp-title__text']/text()[1]

第二个：

//h2[@class='cmp-title__text']/text()[2]

没有 span 作为父节点的文本节点：

//h2[@class='cmp-title__text']/descendant::text()[parent::*[name()!='span']]

结果（包括空格）：

     updated page title


second text



third text

具有 span 父级的第一个文本节点

//h2[@class='cmp-title__text']/descendant::text()[parent::*[name()='span']][1]

同：

//span[1]/text()

Answer 2

您可以拆分从 getText() 获得的字符串

像这样：

var all = pgTitleFromApp.split(' ');
var title = all[0] + all[1] + all[2];

Answer 3

免责声明：下一个答案可能不适合您使用的技术的方法，并且答案仅包含纯 JavaScript 解决方案。

在您的情况下，您可以使用 Node.firstChild。但它仅适用于文本始终是第一个孩子的情况。如果您的文本可以按任何其他顺序放置，您可以使用 Node.childNodes 获取所有节点，通过检查 Node.nodeType 是否等于 Node.TEXT_NODE 来过滤节点并仅保留文本节点。

<div class="wrapper">
   Some text 1
   <h1>Some text 2</h2>
</div>

const wrapper = document.querySelector('.wrapper')
const parentTextNode = [...wrapper.childNodes]
   .filter(node => node.nodeType === Node.TEXT_NODE)[0];

console.log(parentTextNode); // Some text 1

如何仅从父标签而不是从子标签获取文本

3 个答案: