如何仅从父标签而不是从子标签获取文本

时间:2021-07-20 14:10:39

标签: javascript selenium xpath protractor

我只想从下面的代码中获取文本 updated page title

<h2 class="cmp-title__text" xpath="1">
            updated page title
        <span class="gmt_style" aria-hidden="true">Tue, 20 Jul 2021 13:19:22 GMT</span></h2>

我尝试了下面的一个,但它也从 span 标签中获取文本,即 Tue , 20 Jul 2021 13:!9:22 GMT

var pgTitle=element(by.xpath("//h2[@class='cmp-title__text']"));
var pgTitleFromApp = await translatedPgTitle.getText();

输出:

+updated page title
+Tue, 20 Jul 2021 14:02:35 GMT

请帮忙解决这个问题!

3 个答案:

答案 0 :(得分:2)

根据此 html 片段获取 text 节点的 Xpath:

<h2 class="cmp-title__text">
        updated page title
    <span>Tue, 20 Jul 2021 13:19:22 GMT</span>
    
    second text
    
    <span>Tue, 20 Jul 2021 13:19:22 GMT</span>
    
    third text
    
</h2>

可以使用此 xpath 访问第一个文本节点

//h2[@class='cmp-title__text']/text()[1]

第二个:

//h2[@class='cmp-title__text']/text()[2]

没有 span 作为父节点的文本节点:

//h2[@class='cmp-title__text']/descendant::text()[parent::*[name()!='span']]

结果(包括空格):

     updated page title


second text



third text

具有 span 父级的第一个文本节点

//h2[@class='cmp-title__text']/descendant::text()[parent::*[name()='span']][1]

同:

//span[1]/text()

答案 1 :(得分:1)

您可以拆分从 getText() 获得的字符串

像这样:

var all = pgTitleFromApp.split(' ');
var title = all[0] + all[1] + all[2];

答案 2 :(得分:0)

免责声明:下一个答案可能不适合您使用的技术的方法,并且答案仅包含纯 JavaScript 解决方案。

在您的情况下,您可以使用 Node.firstChild。但它仅适用于文本始终是第一个孩子的情况。 如果您的文本可以按任何其他顺序放置,您可以使用 Node.childNodes 获取所有节点,通过检查 Node.nodeType 是否等于 Node.TEXT_NODE 来过滤节点并仅保留文本节点。

<div class="wrapper">
   Some text 1
   <h1>Some text 2</h2>
</div>
const wrapper = document.querySelector('.wrapper')
const parentTextNode = [...wrapper.childNodes]
   .filter(node => node.nodeType === Node.TEXT_NODE)[0];

console.log(parentTextNode); // Some text 1