R中的韩文编码问题

时间:2015-11-11 05:39:52

标签: r windows encoding character

我正在使用处理韩文文本的R代码。下面是一个简单的代码来说明问题:

a <- "안녕"
write.csv(a, "test.csv", fileEncoding = "UTF8")

运行上面的代码给了我一个包含<U+C548><U+B155>而不是안c的csv文件。 RStudio默认运行“utf8”unicode。控制台可以很好地打印对象,但View(a)给出<U+C548><U+B155>,未编码的字符串。 “环境”选项卡还显示值的未编码字符串。

我尝试使用其他使用韩语Windows的计算机运行代码,但它运行良好。所以语言设置可能是根本问题。我实际上使用的是韩语版的Windows 7,但是使用英语作为显示语言。将显示语言恢复为默认(韩语)实际上使它工作!所以可能问题是语言编码冲突或系统中的某些东西。

除了我在韩语中使用韩语Windows之外还有其他解决方法吗? 非常感谢你。

1 个答案:

答案 0 :(得分:0)

您可能想尝试在阅读器包中使用write_csv()。使用您的示例,我能够将“ a”转换为数据框,然后保存。

a<- "안녕"
a<- as.data.frame(a)
write_csv(a, "test.csv")

生成的test.csv具有以下文本: a안녕

但是,如果您在控制台中输入“ a”,则会看到以下内容:

> a
                 a
1 <U+C548><U+B155>