Selenium - 在div中提取文本而不使用其他标记(Python)

时间:2016-01-07 23:52:43

标签: python selenium

试图找出如何在不拉动所有span标签的情况下访问下面屏幕截图中的文字。

执行element = driver.find_elements_by_id('response')会给我一个列表,但我似乎无法进一步深入访问我想要的文本。

我在做了一些搜索之后也尝试了这个:

element = driver.find_element_by_xpath("//div[@id='response']/pre")

但我得到的结果相同。

任何提示?

enter image description here

3 个答案:

答案 0 :(得分:1)

element.text

应该在没有任何HTML标签的情况下给出元素的内容。

答案 1 :(得分:1)

element.get_attribute('innerHTML')

这将帮助您在两个div标签之间获取文本

答案 2 :(得分:0)

如果文本位于纯 div 中,则不会使用element.text

提取文本

示例:

<div>the text here</div>

我建议使用一个名为 html2text 的库以及下一个:

html2text(element.get_attribute("outerHTML"))

它将成功!