格式化从HTML中提取的文本

时间:2017-12-14 11:09:35

标签: python-3.x selenium

我从这个HTML获取一行文字:

<label class="product_title"> 
  "TEXT 1" 
  <br> 
  "TEXT2" 
</label>

我的代码是:

title = amazon.find_element_by_css_selector(
  'div > div > label').get_attribute('innerText')

当前输出:

TEXT
TEXT1

期望的输出:

TEXT TEXT1

问题

如何获得所需的输出?

1 个答案:

答案 0 :(得分:0)

您可以使用空格替换换行符,如下所示:

title = amazon.find_element_by_css_selector('div > div > label').get_attribute('innerText').replace("\n", " ")