我在这样的文本文件中有一些大内容:
1. name="user1” age="21”
2. name="user2” age="25”
....
如果我们注意到每个单词的末尾都有这个(”
)特殊类型的引用。
我只想用正常引用(”
)替换该引用("
)
代码:
import codecs
f = codecs.open('myfile.txt',encoding='utf-8')
for line in f:
print "str text : ",line
a = repr(line)
print "repr text : ",a
x = a.replace(u'\u201d', '"')
print "new text : ",x
输出:
str text : 1. name="user1” age="21”
repr text : u'1. name="user1\u201d age="21\u201d\n'
new text : u'1. name="user1\u201d age="21\u201d\n'
但它不起作用。我在这里缺少什么?
更新:
我刚试过这个:
import codecs
f = codecs.open('one.txt')
for line in f:
print "str text : ",line
y= line.replace("\xe2\x80\x9d", '"')
print "ynew text : ",y
现在正在运作。
我仍然想知道x = a.replace(u'\u201d', '"')
答案 0 :(得分:2)
a
是该行的 repr ,其中不包含字符”
,但包含字符串\
u
,2
,0
,1
,d
。
因此,将a = repr(line)
更改为a = line
将解决问题。