Python / Selenium - WebElement的text属性截断重复的空格

时间:2016-06-30 00:27:26

标签: python html selenium dom selenium-webdriver

我想分享与 WebElement text 属性相关的观察结果。我有一个pdf链接: enter image description here

文件名有三个空格,当我尝试获取标记 中包含的元素的 text 属性时,只需从额外的空格中接收截断的字符串:

“03057895_05-01-2015_platform express array induction sp gr hsts neutron density log.pdf”

找到这个问题非常关键,因为我使用文本来识别下载的文件名并监控文件的下载状态。

任何人都遇到过类似的事情,或者知道为什么它会以这种方式运作?

1 个答案:

答案 0 :(得分:0)

正如@Eric评论的那样,这不是硒的问题。这是您的应用程序中的问题。 但是,如果您真的想要获取该文本,则必须获取属性innerHTML。请参阅以下代码:

text = driver.find_element_by_css_selector("a").get_attribute("innerHTML")