R:UTF-8字符字节为Latin-1个字符字节

时间:2017-01-26 12:22:04

标签: r encoding utf-8 character iso-8859-1

我将UTF-8字符字节作为Latin-1字符字节。示例包含

Latin 1 character bytes        ----- UTF-8 bytes
äännök                      ----- äännök
Ã<U+0084>Ã<U+0084>NÃ<U+0096>S  ----- äänös 

和我的会话信息

> sessionInfo()
R version 3.3.2 (2016-10-31)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: macOS Sierra 10.12.1

locale:
[1] C/UTF-8/C/C/C/C

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

那么在R中我需要什么样的设置才能正确处理变音符号(不要将UTF-8字节作为Latin-1字符字节返回)?

相关?

  
      
  1. Turn Unicode into Umlaut in R on Mac (Facebook Data)

  2.   
  3. https://stackoverflow.com/a/22945233/164148

  4.   
  5. 显然是this,我需要

  6.         
        

    如果您使用“LC_CTYPE”或“LC_ALL”调用 Sys.setlocale 来在RStudio运行时更改系统区域设置,则可能会遇到一些未成年人RStudio的问题假定系统编码不会改变。如果您使用的是Windows,我们建议您只在.Rprofile 中调用 Sys.setlocale。如果您使用的是Mac或Linux并且想要更改系统区域设置,请访问支持论坛并告诉我们您的方案。

      
         
        
    1. 是否存在将Latin-1字符字节转换为UTF-8字符字节的简单工具?
    2.   

P.S。我现在在Linux上的R和OSX上的R中测试了这个,我得到了将UTF-8字符字节解释为Latin-1字符字节的相同问题。

0 个答案:

没有答案