使用BeautifulSoup删除td元素之间/之后的空格

时间:2016-01-08 00:17:12

标签: python html beautifulsoup

任何人都知道如何使用漂亮的汤去除td元素之间的空格?

例如

<table>
  <tr class="soup-target">
    <td></td>     <td></td>
  </tr>
</table>

在你说&#34之前,只需使用删除键&#34;,这是不可能的,因为我在td元素上使用带有循环的模板语言,并且语言没有&#39; ; t允许空间控制循环元素上的空格或换行符。

2 个答案:

答案 0 :(得分:1)

您还可以直接过滤tr内的文本节点并提取它们:

row = soup.find("tr", class_="soup-target")
for text_node in row.find_all(text=True, recursive=False):
    text_node.extract()

答案 1 :(得分:0)

想出这个

el = soup.find_all('tr', {'class': 'soup-target'})
if el:
    for node in el:
        for child in node.children:
            if isinstance(child, NavigableString):
                child.extract()