如何检查python中字符的utf-8等效值?

时间:2014-03-11 08:21:29

标签: python python-2.7 python-3.x

我想知道如何找到相当于泰米尔字符的utf-8。它有什么功能吗?你能给出语法吗?

for line in f:
    words = line.strip().split() 
    for word1, word2 in zip(words, words[1:]): 
            if word1 == '1' and word2 == "கோடி":
                ff.write("onru\n")
                ff.write(word2+'\n')
            else:
                ff.write(word1+'\n')
                ff.write(word2+'\n')

但它在第5行的文件replacement.py中给出了SyntaxError:非ASCII字符'\ xe0',但没有声明编码。那么如何阅读非ascii字符或如何阅读泰米尔语单词。主要是如何比较和检查。 Thanx提前。

2 个答案:

答案 0 :(得分:1)

错误发生在Python开始执行文件之前,因为它检测到非ASCII字符。 (顺便说一下,这是一个仅限Python 2的问题,因此您应该从帖子中删除python-3.x标记。)

要告诉Python文件是用UTF-8编码的,你应该在文件的开头添加它(如PEP 263中所定义):

# -*- coding: utf8 -*-

答案 1 :(得分:0)

我不知道它在技术上是否有任何区别,但我只是删除了双引号并用单引号替换它们,现在我的pgm工作了。它正确地进行比较。现在正在给予' கோடி'而不是" கோடி"。我试过你,你' / கோடி,你" கோடி。所有这些都是错误的。