假设我收到一个用MS Word编写的西班牙文本并保存为纯文本(.txt)。不幸的是,所有的西班牙口音都显示如下:
Un \372ltimo an\341lisis
任何人都可以告诉我如何避免这种情况,或者至少我如何能够取代这些角色?替换regexp函数根本找不到它们,否则我可以编写一个小的elisp函数,用相关的西班牙语重音字符替换它们的每个出现。
答案 0 :(得分:3)
这看起来像ISO 8859-1(Latin-1)编码。
使用该编码系统访问该文件。如果Emacs没有自动识别编码系统,您可以使用revert-buffer-with-coding-system
(C-x RET r
)的显式编码系统重新访问该文件。
例如,如果您正在查看您描述的乱码文件,
C-x RET r
latin-1 RET
yes RET
然后,您可以设置要保存的编码系统(C-x RET f
)并指定utf-8
之类的内容。