如何在输出的BeautifulSoup中删除“ \ n \ r \ n”

时间:2018-08-22 13:04:31

标签: python-3.x

我有这样的代码

use std::collections::HashMap;

fn main() {
    let mut best_pos: HashMap<(usize, usize), f64> = Default::default();
    let newprice = 60.0;

    best_pos
        .entry((1, 2))
        .and_modify(|e| *e = e.min(newprice))
        .or_insert(newprice);
}

我的输出就是这样

from bs4 import BeautifulSoup
import requests
import re

page = open('doc1.html','rb').read()
soup = BeautifulSoup(page,'lxml')
# print(soup.prettify())

# eng = soup.find_all(string = re.compile("righteou"))
# print(eng)

# heb = soup.findAll('p',{'dir':'RTL'})
# print(heb)
list=[]
all_tr =soup.findAll('tr')
for td in all_tr:
    all_td = soup.findAll('td')
    d={
    'hob':all_td[0].text.strip(),
    'english':all_td[1].text.strip()

        }
    list.append(d)
print(list)

我想从输出中删除\ n \ t,我的文件将被清除..我该怎么做????

1 个答案:

答案 0 :(得分:1)

将单词分开并用空格隔开。

'english':" ".join(all_td[1].text.split())

这将删除所有“ \ n”,“ \ r”,“”。