我的txt表如下所示:
morče kanár malý pes
morče potkan rybičky
želva rybičky střední pes
kočka papoušek želva
它以UTF-8编码并存储在文件mazlicci.txt
中。当我尝试
library(rio)
import("mazlicci.txt")
字符编码被破坏。
如何控制rio
包中的字符编码? encoding
中的import
参数只知道三个字符集:UTF-8
,unknown
和Latin-1
。 UTF-8
选项无法解决问题。 (预计也不是其他的。)我正在使用Windows 7,R version 3.2.4 (2016-03-10) -- "Very Secure Dishes", Platform: i386-w64-mingw32/i386 (32-bit)
,捷克语语言环境(cp1250)。使用基本的R导入功能,我没有遇到UTF-8编码文件的编码问题。
答案 0 :(得分:2)
您可以在import
函数中指定编码:
library(rio)
import("mazlicci.txt", encoding = "UTF-8")