我正在使用处理韩文文本的R代码。下面是一个简单的代码来说明问题:
a <- "안녕"
write.csv(a, "test.csv", fileEncoding = "UTF8")
运行上面的代码给了我一个包含<U+C548><U+B155>
而不是안c的csv文件。 RStudio默认运行“utf8”unicode。控制台可以很好地打印对象,但View(a)
给出<U+C548><U+B155>
,未编码的字符串。 “环境”选项卡还显示值的未编码字符串。
我尝试使用其他使用韩语Windows的计算机运行代码,但它运行良好。所以语言设置可能是根本问题。我实际上使用的是韩语版的Windows 7,但是使用英语作为显示语言。将显示语言恢复为默认(韩语)实际上使它工作!所以可能问题是语言编码冲突或系统中的某些东西。
除了我在韩语中使用韩语Windows之外还有其他解决方法吗? 非常感谢你。
答案 0 :(得分:0)
您可能想尝试在阅读器包中使用write_csv()
。使用您的示例,我能够将“ a”转换为数据框,然后保存。
a<- "안녕"
a<- as.data.frame(a)
write_csv(a, "test.csv")
生成的test.csv具有以下文本: a안녕
但是,如果您在控制台中输入“ a”,则会看到以下内容:
> a
a
1 <U+C548><U+B155>