读取包含韩语的CSV时出错

时间:2018-07-02 11:38:26

标签: r read.csv korean-nlp

我正在尝试使用以下几行读取CSV文件,其中一列包含韩文

Sys.setlocale(category="LC_ALL", locale = "Korean")
old <- read.csv("Past-Korean.csv", encoding = "utf-8",header=T,na.strings=c("")) 

但是我遇到了错误

Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, numerals = numerals,  : 
  invalid multibyte string at '<ec><8b><9c>스템 ë¬¸ì œ'

我能够使用类似的语法来阅读中文和日语,但是在阅读韩语时却遇到问题 有人可以帮我吗?

1 个答案:

答案 0 :(得分:2)

由于没有样本数据,我无法对其进行测试,但是您介意尝试这种方法吗?

library(readr)
locale("ko")

df <- read_csv(file = "your_csv_file.csv", 
               locale = locale(date_names = "ko", encoding = "UTF-8"))