如何摆脱python字符串中的奇怪字符?

时间:2015-04-29 14:17:55

标签: python regex string

我的行包含一些讨厌的控制字符:

enter image description here

当我尝试读取文件然后执行str.replace()时,这些控制字符没有被替换。我已经尝试过了,但它仍然坚持下去。

with io.open('infile', 'r', encoding='utf8') as fin:
    for line in fin:
        line = line.replace(u'\u0094', '"').replace(u'\u0093', '"').replace(u'\u0092', "'").replace(u'\u0096', '"').replace(u'\u0084', '"')

如何更换这些字符串?是否有一种替代这些字符串的规范方法(它们看起来像各种类型的引号/空格)?

这些角色究竟是什么?什么是u'\u0084'

0 个答案:

没有答案