替换来自beautifulsoup的\ n \ t

时间:2016-02-15 15:44:07

标签: python replace beautifulsoup special-characters

您好我使用的是BeautifulSoup 4,我尝试更换" \ n \ t"汤文中的人物。

这是我的代码:

$(id[value]).css('padding', '5px');

这是我的ouptut:

soup = BS(html_doc, "html.parser")
for tableItem in soup.find_all("td"):
    result = str(tableItem.string)
    result = result.replace("\n\t\", "")
    print(result)

我尝试使用编码或者使用beautifulsoup" NavigableString"。我使用错误的编码吗?或者是beautifulsoup的特殊方法。 (如stripped_strings)

ps:我可以替换TEXT_I_WANT但不能替换#34; \ n"或" \ t"

2 个答案:

答案 0 :(得分:2)

这一行:result = result.replace("\n\t\", "")查找\n\t的所有实例,然后替换它们 - 它不会查找\n {{1 }}。看来你想要的是:

\t

答案 1 :(得分:1)

您实际上需要get_text()而不是stringget_text()也可以删除哪些内容有助于您删除文本开头和结尾的\n\t

soup = BS(html_doc, "html.parser")
for tableItem in soup.find_all("td"):
    print(tableItem.get_text(strip=True))