Emacs - 如何避免或替换错误的字符编码?

时间:2012-06-17 16:37:34

标签: emacs encoding utf-8 ms-word dos

假设我收到一个用MS Word编写的西班牙文本并保存为纯文本(.txt)。不幸的是,所有的西班牙口音都显示如下:

Un \372ltimo an\341lisis

任何人都可以告诉我如何避免这种情况,或者至少我如何能够取代这些角色?替换regexp函数根本找不到它们,否则我可以编写一个小的elisp函数,用相关的西班牙语重音字符替换它们的每个出现。

1 个答案:

答案 0 :(得分:3)

这看起来像ISO 8859-1(Latin-1)编码。

使用该编码系统访问该文件。如果Emacs没有自动识别编码系统,您可以使用revert-buffer-with-coding-systemC-x RET r)的显式编码系统重新访问该文件。

例如,如果您正在查看您描述的乱码文件,

C-x RET r
latin-1 RET
yes RET

然后,您可以设置要保存的编码系统(C-x RET f)并指定utf-8之类的内容。