Python Beautifulsoup:如何摆脱' \ n'在html标签的文本中

时间:2016-03-19 03:20:43

标签: python html beautifulsoup

我尝试使用python:

将数据写入csv文件
soup = BeautifulSoup(html)
ticketCount=soup.find_all('span',id='ticket_count')
records.append(ticketCount)

但我得到的是:

<span id=""ticket_count"">15695.3\n                   \u4e07\n            </span>]

有一些烦人的&#39; \ n&#39;在文中,我怎样才能摆脱它们并使我的输出更优雅?

1 个答案:

答案 0 :(得分:1)

使用get_text(strip=True)

from bs4 import BeautifulSoup

soup = BeautifulSoup(html)
ticketCount = soup.find('span', id='ticket_count').get_text(strip=True)
print(ticketCount)