Selenium - 如何获取元素及其子元素文本

时间:2013-06-07 06:15:12

标签: java xpath selenium-webdriver webdriver

简短版本:我可以获取聊天消息(在java中使用selenium的By.xpath),但我希望将微笑包含在适当的位置。

更长的版本: 你好, 我一直在处理这个有趣的问题,我需要从Web浏览器解析聊天消息并使用java和selenium重新创建它。我没有解析消息文本的问题,但我想用它的子元素(微笑图标)解析它。除了手动源代码解析之外,有没有什么好方法呢?

以下是我能够访问的单个邮件的代码:

<div class="chat_msg chat_msg_caller ">
    <div class="chat_msg_head">
        <span class="chat_msg_author">
            SomeAuthor
        </span>
        <span class="chat_msg_date">
           SomeDate
        </span>
    </div>
    <div class="chat_msg_body message_text">
        SomeMessageText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
        SomeOtherText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
    </div>
</div>

以下是我如何获取聊天消息文本的示例:

String msgTxt = we.findElement(By.xpath("//div[@id='messages_body']/div[" + (i + 1) + "]/div[@class='chat_msg_body message_text']")).getText();

我的结果: SomeMessageText SomeOtherText 我想要的结果: SomeMessageText:D SomeOtherText:D

CSS文件:

http://badoocdn.com/v2/-/-/css/base-ltr.268.css
http://badoocdn.com/v2/-/-/css/page.chat-ltr.22.css
http://badoocdn.com/v2/-/-/css/popup.messenger-ltr.230.css

结构:

<div id="messages_body">
   <div id="pager" class="pages"> … </div>
   <div class="chat_msg chat_msg_caller ">
       <div class="chat_msg_head">
          <span class="chat_msg_author"> … </span>
          <span class="chat_msg_date"> … </span>
       </div>
       <div class="chat_msg_body message_text"> … </div>
   </div>
   <div class="me chat_msg chat_msg_owner "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="me chat_msg chat_msg_owner "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   ...

2 个答案:

答案 0 :(得分:11)

如果我正确理解你,你只需要在父元素上执行getText(),例如

driver.findElement(By.cssSelector(".chat_msg_body message_text")).getText()

这应该返回

  

SomeMessageText:D SomeOtherText:D

它可能会移除一些空格,你需要先去看看。

修改

看到你正在处理潜在的CSS问题,你可以尝试以下方法:

driver.findElement(By.cssSelector(".chat_msg_body message_text")).getAttribute("textContent")

即使CSS正在移动所有地方,也应该获得textContent。

答案 1 :(得分:0)

我是怎么做到的,
1.我打开Selenium IDE,
2.从我想要获得的网站中选择文本 3.右键单击并使用可用的命令
4.假设我们使用验证文本。
5.停止录制并将录制内容转换为webdriver 你得到你的代码。这很简单,总是为我工作。
你可以尝试

 (new WebDriverWait(driver, 60)).until(ExpectedConditions
                .textToBePresentInElement(By.id("Element ID"),
                        "Text to verify"));