不同div标签内的文本在没有空格的情况下连接

时间:2017-08-09 15:41:53

标签: python html python-3.x web-scraping beautifulsoup

我已经删除了部分html文件并将其转换为BeautifulSoup对象。我想得到它的文本内容但是当有相邻的div标签时,它们会在没有空格的情况下加入,这很烦人,对我来说听起来不合理。 例如:

BeautifulSoup('<div>Hello</div><div>World</div>').get_text()

这会为您提供HelloWorld,而非Hello World或其他内容。 我该如何解决?

1 个答案:

答案 0 :(得分:1)

你可以试试这个:

BeautifulSoup('<div>Hello</div><div>World</div>').get_text(' ')

如果您使用bs4,则可以在get_text中添加' '参数。有关更多解决方案,请查看this