无法读取python中的特殊字符

时间:2014-02-06 09:43:58

标签: python special-characters

我在python中有一个程序来读取以下字符串

gh ́gfh

在此字符串中,位置3处的字符为́,位置4处的字符为g,您可以通过剪切并粘贴该位置来识别。

但是我无法读取字符串中第3位的字符́

我试图转换为字符串和unicode,但问题仍然存在。

,程序如下,

#!/usr/bin/python
# coding=utf-8

import io

f = io.open("mapping_input.txt",'r')

while True:

    c = f.read(1)
    if not c:
        break
    else:
        print c

1 个答案:

答案 0 :(得分:0)

进行I / O时,您需要知道数据格式。对于文本文件,这意味着您需要知道编码字符集。因此,第一步是了解mapping_input.txt是如何创建的以及保存的编码方式。例如,如果您使用UTF-8,则可以使用codecs模块读取文件:

f = codecs.open("mapping_input.txt", 'r', encoding='utf-8')