我有一个不是由我创建的文件,其中包含一些非ascii字符。文件名为foo.in
。在那里有一个土耳其语单词rahatlattı。最后一个字符是非ascii。文件格式为foo.in: text/html; charset=iso-8859-1
。当我用较少的命令打开文件时,我看到该单词被写为rahatlatt<FD>
这对我来说不是问题。但是当我尝试创建一个类似的文件时,我无法以同样的方式创建它。最重要的是,我尝试以下方法:
import codecs
outputFile = codecs.open("foo2.in","w","ISO-8859-1")
p = unicode('rahatlatt\u0131n')
outputFile.write(p)
outputFile.close()
不幸的是,当我检查文件的内容和格式时,我发现该格式设置为foo2.in: text/plain; charset=us-ascii
,内容写为rahatlatt\u0131n
所以,我想知道如何创建一个类似于foo.in的文件。我的请求背后的原因是,另一个程序将这些文件作为输入,我想文件的格式对它很重要,我不能用另一种文件格式运行程序。