使用Python Selenium获取跨文本

时间:2013-01-29 19:05:44

标签: python selenium

这应该很简单,但我无法让它发挥作用。我正在使用Google主页作为测试运行一个小演示。

这是我的剧本:

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
import time

browser = webdriver.Chrome()
browser.get("http://www.google.com") # Load page

time.sleep(0.2)

#top nav elements
elems = browser.find_elements_by_xpath("//span[contains(@class, 'gbts')]") 

for e in elems:
    print e.get_attribute('text')

browser.close()

它返回:

None
None
None
None
None
None
None
None
None
None
None

所以我认为它抓住了正确的元素,但也许不是正确的属性?不确定。我也尝试打印e.text(),但吐了出来:

Traceback (most recent call last):
  File "sample.py", line 14, in <module>
    print e.text()
TypeError: 'unicode' object is not callable

有什么想法吗?

* 编辑 - 可能的解决方案? *

e.get_attribute('innerHTML') seems to work.

2 个答案:

答案 0 :(得分:23)

这应该这样做:

from selenium import webdriver
browser = webdriver.Firefox()
browser.get("http://www.google.com")
for elem in browser.find_elements_by_xpath('.//span[@class = "gbts"]'):
    print elem.text

textWebElement类的属性,因此无法调用。

class WebElement(object):
    """Represents an HTML element.       
    ...
    ...

    @property
    def text(self):
        """Gets the text of the element."""
        return self._execute(Command.GET_ELEMENT_TEXT)['value']

你有两种选择来获得第三场比赛:

#  1. Modify your xpath expression
browser.find_elements_by_xpath('(.//span[@class = "gbts"])[3]')[0].text

#  2. Access it by list index
browser.find_elements_by_xpath('.//span[@class = "gbts"])')[2].text

答案 1 :(得分:10)

是的!解决方案被发现(我使用Python) 对于instanc:webelement是一个p标签

webelement.text()  

从实际情况来看,堆栈跟踪:

print page_box_block.text() TypeError:&#39; unicode&#39;对象不可调用

它希望是stdout中的html,但不是!

有时可能是一个奇怪的字符串&#34; unicode对象不可调用&#34;或某种类型的错误 解决方案非常简单:

print element.get_attribute("innerHTML")

在java中get_attribute(&#34; innerHTML&#34;)和text()即将到来#34;相同&#34;,如果你需要来自元素的纯文本 在Python 2.7中,text()有时会失败。