我有一些python代码,其中包含对某些印地文文本的识别。我故意将其另存为UTF-8
,但是当我重新打开它时,印地文符号会变成俄语文本(大部分是)或只是?
。编码也更改为西里尔文的OEM 866
。
由于此编码更改,我的代码也完全没有运行,因为正则表达式将?
视为特殊输入。那我该怎么办?
答案 0 :(得分:1)
将脚本编码为utf-8-BOM
就可以了。但是BOM
本身有problems of it's own。基本上,如果您使用的是Shebang,那么使用BOM编码将使脚本无法解释。
编辑:github rddim上的notepad ++贡献者回复了issue opened by me:
我无法重现此内容,因为可能是我错过了字体。 1日 屏幕上,文件位于
UTF-8
中,第二个文件位于OEM-866
中。 检查Settings > Preferences... > MISC..
中自动检测字符编码的状态,如果启用,则将其禁用,然后重试。 信息错过了? >调试信息...
为我工作。