您好我使用的是BeautifulSoup 4,我尝试更换" \ n \ t"汤文中的人物。
这是我的代码:
$(id[value]).css('padding', '5px');
这是我的ouptut:
soup = BS(html_doc, "html.parser")
for tableItem in soup.find_all("td"):
result = str(tableItem.string)
result = result.replace("\n\t\", "")
print(result)
我尝试使用编码或者使用beautifulsoup" NavigableString"。我使用错误的编码吗?或者是beautifulsoup的特殊方法。 (如stripped_strings)
ps:我可以替换TEXT_I_WANT但不能替换#34; \ n"或" \ t"
答案 0 :(得分:2)
这一行:result = result.replace("\n\t\", "")
查找\n\t
的所有实例,然后替换它们 - 它不会查找\n
或 {{1 }}。看来你想要的是:
\t
答案 1 :(得分:1)
您实际上需要get_text()
而不是string
。 get_text()
也可以删除哪些内容有助于您删除文本开头和结尾的\n
和\t
:
soup = BS(html_doc, "html.parser")
for tableItem in soup.find_all("td"):
print(tableItem.get_text(strip=True))