Question

我想知道如何找到相当于泰米尔字符的utf-8。它有什么功能吗？你能给出语法吗？

for line in f:
    words = line.strip().split() 
    for word1, word2 in zip(words, words[1:]): 
            if word1 == '1' and word2 == "கோடி":
                ff.write("onru\n")
                ff.write(word2+'\n')
            else:
                ff.write(word1+'\n')
                ff.write(word2+'\n')

但它在第5行的文件replacement.py中给出了SyntaxError：非ASCII字符'\ xe0'，但没有声明编码。那么如何阅读非ascii字符或如何阅读泰米尔语单词。主要是如何比较和检查。 Thanx提前。

Answer 1

错误发生在Python开始执行文件之前，因为它检测到非ASCII字符。（顺便说一下，这是一个仅限Python 2的问题，因此您应该从帖子中删除python-3.x标记。）

要告诉Python文件是用UTF-8编码的，你应该在文件的开头添加它（如PEP 263中所定义）：

# -*- coding: utf8 -*-

Answer 2

我不知道它在技术上是否有任何区别，但我只是删除了双引号并用单引号替换它们，现在我的pgm工作了。它正确地进行比较。现在正在给予＆＃39; கோடி＆＃39;而不是＆＃34; கோடி＆＃34;。我试过你，你＆＃39; / கோடி，你＆＃34; கோடி。所有这些都是错误的。

如何检查python中字符的utf-8等效值？

2 个答案: