源窗口中的随机符号,而不是RStudio中的俄语字符

时间:2018-02-28 11:52:23

标签: encoding rstudio

我一直在谷歌搜索和stackoverflowing(是的,现在这个词)如何解决错误编码的问题。但是,我找不到解决方案。

我正在尝试使用 UTF-8 编码加载.Rmd文件,该编码基本上包含俄文字符。他们没有正确显示。相反,Source窗口中的代码行如下所示:

the random symbols are Russian characters (1) the random symbols are Russian characters (2)

最初,我很久以前在我以前的笔记本电脑上创建了这个.Rmd文件。现在,我正在使用另一个,我无法在这里发现问题。

我已经尝试使用某些Sys.setlocale()命令但没有成功。

  

我在 Windows 10 上运行 RStudio

     

被修改

这是readBin('raw[1].Rmd', raw(), 10000)的输出。切片从2075年到2211年:

[2075] 64 31 32 2c 20 71 68 35 20 3d 3d 20 22 d0 a0 d1 9a d0 a0 d0 88 d0 a0 
e2 80 93 d0 a0 d0 8e d0 a0 d1 99
[2109] d0 a0 d1 9b d0 a0 e2 84 a2 22 29 3b 20 64 31 32 6d 24 71 68 35 20 3d 
20 4e 55 4c 4c 0d 0a 64 31 35 6d
[2143] 20 3d 20 66 69 6c 74 65 72 28 64 31 35 2c 20 74 68 35 20 3d 3d 20 22 
d0 a0 d1 9a d0 a0 d0 88 d0 a0 e2
[2177] 80 93 d0 a0 d0 8e d0 a0 d1 99 d0 a0 d1 9b d0 a0 e2 84 a2 22 29 3b 20 
64 31 35 6d 24 74 68 35 20 3d 20

谢谢。

1 个答案:

答案 0 :(得分:1)

Windows对UTF-8没有很好的支持。可能你的本地编码是别的。

RStudio通常使用系统编码读取文件。如果这是错误的,您可以使用"文件|重新打开编码..."使用不同的编码重新打开文件。

编辑添加:

示例输出的第一行看起来像带有一些西里尔字母的UTF-8编码,但不是俄语文本。我将其解码为"d12, qh5 == \"РњРЈР–РЎРљ"。当你重新打开文件时,RStudio给你的是什么,宣称它是UTF-8?