读取多语言数据

时间:2018-07-06 04:03:54

标签: r encoding import multilingual

我正在尝试读取其中语言文本数据不止一种的数据。

在R中阅读时,我正在使用以下语法。

Sys.setlocale(category="LC_ALL", locale = "Japanese")
df <- read.csv(file = "Japanese.csv",  encoding = "UTF-8",header=T,na.strings=c(""))

如果文件包含日语文本,则我可以正确读取日语字符,但是脚本无法读取中文字符。 当我尝试用R代替中文查看数据时,我得到了提示。

<U+95EE><U+9898> 

如果我们可以读取包含两种以上语言文本数据的数据,谁能帮忙。

下面是我正在使用的示例数据

Num Group   Text
1   Group1  パスワードの問題
2   Group1  ログインに関する問題
3   Group2  システムに関する問題
4   Group2  问题与内存
5   Group3  问题与登录
6   Group3  与系统问题

1 个答案:

答案 0 :(得分:-1)

请尝试以下操作-抱歉,没有方便的日语文本进行测试。

   df<- read.csv("your_file.csv", fileEncoding="cp932")