控制字符编码在' rio'包?

时间:2016-04-01 10:05:32

标签: r encoding import character-encoding packages

我的txt表如下所示:

morče   kanár   malý pes
morče   potkan  rybičky
želva   rybičky střední pes
kočka   papoušek    želva

它以UTF-8编码并存储在文件mazlicci.txt中。当我尝试

library(rio)
import("mazlicci.txt")

字符编码被破坏。

如何控制rio包中的字符编码? encoding中的import参数只知道三个字符集:UTF-8unknownLatin-1UTF-8选项无法解决问题。 (预计也不是其他的。)我正在使用Windows 7,R version 3.2.4 (2016-03-10) -- "Very Secure Dishes", Platform: i386-w64-mingw32/i386 (32-bit),捷克语语言环境(cp1250)。使用基本的R导入功能,我没有遇到UTF-8编码文件的编码问题。

1 个答案:

答案 0 :(得分:2)

您可以在import函数中指定编码:

library(rio)
import("mazlicci.txt", encoding = "UTF-8")