我的行包含一些讨厌的控制字符:
当我尝试读取文件然后执行str.replace()
时,这些控制字符没有被替换。我已经尝试过了,但它仍然坚持下去。
with io.open('infile', 'r', encoding='utf8') as fin:
for line in fin:
line = line.replace(u'\u0094', '"').replace(u'\u0093', '"').replace(u'\u0092', "'").replace(u'\u0096', '"').replace(u'\u0084', '"')
如何更换这些字符串?是否有一种替代这些字符串的规范方法(它们看起来像各种类型的引号/空格)?
这些角色究竟是什么?什么是u'\u0084'
?