我一直在谷歌搜索和stackoverflowing(是的,现在这个词)如何解决错误编码的问题。但是,我找不到解决方案。
我正在尝试使用 UTF-8 编码加载.Rmd
文件,该编码基本上包含俄文字符。他们没有正确显示。相反,Source窗口中的代码行如下所示:
最初,我很久以前在我以前的笔记本电脑上创建了这个.Rmd
文件。现在,我正在使用另一个,我无法在这里发现问题。
我已经尝试使用某些Sys.setlocale()
命令但没有成功。
我在 Windows 10 上运行 RStudio 。
这是readBin('raw[1].Rmd', raw(), 10000)
的输出。切片从2075年到2211年:
[2075] 64 31 32 2c 20 71 68 35 20 3d 3d 20 22 d0 a0 d1 9a d0 a0 d0 88 d0 a0
e2 80 93 d0 a0 d0 8e d0 a0 d1 99
[2109] d0 a0 d1 9b d0 a0 e2 84 a2 22 29 3b 20 64 31 32 6d 24 71 68 35 20 3d
20 4e 55 4c 4c 0d 0a 64 31 35 6d
[2143] 20 3d 20 66 69 6c 74 65 72 28 64 31 35 2c 20 74 68 35 20 3d 3d 20 22
d0 a0 d1 9a d0 a0 d0 88 d0 a0 e2
[2177] 80 93 d0 a0 d0 8e d0 a0 d1 99 d0 a0 d1 9b d0 a0 e2 84 a2 22 29 3b 20
64 31 35 6d 24 74 68 35 20 3d 20
谢谢。
答案 0 :(得分:1)
Windows对UTF-8没有很好的支持。可能你的本地编码是别的。
RStudio通常使用系统编码读取文件。如果这是错误的,您可以使用"文件|重新打开编码..."使用不同的编码重新打开文件。
编辑添加:
示例输出的第一行看起来像带有一些西里尔字母的UTF-8编码,但不是俄语文本。我将其解码为"d12, qh5 == \"РњРЈР–РЎРљ"
。当你重新打开文件时,RStudio给你的是什么,宣称它是UTF-8?