我将UTF-8字符字节作为Latin-1字符字节。示例包含
Latin 1 character bytes ----- UTF-8 bytes
äännök ----- äännök
Ã<U+0084>Ã<U+0084>NÃ<U+0096>S ----- äänös
和我的会话信息
> sessionInfo()
R version 3.3.2 (2016-10-31)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: macOS Sierra 10.12.1
locale:
[1] C/UTF-8/C/C/C/C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
那么在R中我需要什么样的设置才能正确处理变音符号(不要将UTF-8字节作为Latin-1字符字节返回)?
相关?
- 醇>
显然是this,我需要
如果您使用“LC_CTYPE”或“LC_ALL”调用 Sys.setlocale 来在RStudio运行时更改系统区域设置,则可能会遇到一些未成年人RStudio的问题假定系统编码不会改变。如果您使用的是Windows,我们建议您只在.Rprofile 中调用 Sys.setlocale。如果您使用的是Mac或Linux并且想要更改系统区域设置,请访问支持论坛并告诉我们您的方案。
- 是否存在将Latin-1字符字节转换为UTF-8字符字节的简单工具?
醇>
P.S。我现在在Linux上的R和OSX上的R中测试了这个,我得到了将UTF-8字符字节解释为Latin-1字符字节的相同问题。