我想知道如何找到相当于泰米尔字符的utf-8。它有什么功能吗?你能给出语法吗?
for line in f:
words = line.strip().split()
for word1, word2 in zip(words, words[1:]):
if word1 == '1' and word2 == "கோடி":
ff.write("onru\n")
ff.write(word2+'\n')
else:
ff.write(word1+'\n')
ff.write(word2+'\n')
但它在第5行的文件replacement.py中给出了SyntaxError:非ASCII字符'\ xe0',但没有声明编码。那么如何阅读非ascii字符或如何阅读泰米尔语单词。主要是如何比较和检查。 Thanx提前。
答案 0 :(得分:1)
错误发生在Python开始执行文件之前,因为它检测到非ASCII字符。 (顺便说一下,这是一个仅限Python 2的问题,因此您应该从帖子中删除python-3.x
标记。)
要告诉Python文件是用UTF-8编码的,你应该在文件的开头添加它(如PEP 263中所定义):
# -*- coding: utf8 -*-
答案 1 :(得分:0)
我不知道它在技术上是否有任何区别,但我只是删除了双引号并用单引号替换它们,现在我的pgm工作了。它正确地进行比较。现在正在给予' கோடி'而不是" கோடி"。我试过你,你' / கோடி,你" கோடி。所有这些都是错误的。