我已经删除了部分html文件并将其转换为BeautifulSoup对象。我想得到它的文本内容但是当有相邻的div标签时,它们会在没有空格的情况下加入,这很烦人,对我来说听起来不合理。 例如:
BeautifulSoup('<div>Hello</div><div>World</div>').get_text()
这会为您提供HelloWorld
,而非Hello World
或其他内容。
我该如何解决?
答案 0 :(得分:1)
你可以试试这个:
BeautifulSoup('<div>Hello</div><div>World</div>').get_text(' ')
如果您使用bs4,则可以在get_text中添加' '
参数。有关更多解决方案,请查看this