我在python中有一个程序来读取以下字符串
gh ́gfh
在此字符串中,位置3处的字符为́
,位置4处的字符为g,您可以通过剪切并粘贴该位置来识别。
但是我无法读取字符串中第3位的字符́
。
我试图转换为字符串和unicode,但问题仍然存在。
,程序如下,
#!/usr/bin/python
# coding=utf-8
import io
f = io.open("mapping_input.txt",'r')
while True:
c = f.read(1)
if not c:
break
else:
print c
答案 0 :(得分:0)
进行I / O时,您需要知道数据格式。对于文本文件,这意味着您需要知道编码或字符集。因此,第一步是了解mapping_input.txt
是如何创建的以及保存的编码方式。例如,如果您使用UTF-8
,则可以使用codecs
模块读取文件:
f = codecs.open("mapping_input.txt", 'r', encoding='utf-8')