Question

我有一个日语文本csv文件，由制表符分隔它是使用python csv包以utf-8编写的但是，当我使用如下命令在RStudio中将其导入时

A <- read.csv("reviews4.csv",sep="\t",header = F,encoding="UTF-8")

日语字符将显示如下：

<U+8AAC>明無<U+3057><U+306B><U+5185>容量<U.....

我认为它只能正确显示汉字部分。

我尝试编码=“ CP932” 它会显示：隤祆<98><81><86>嗒<87><....

然后，我尝试了另一种方法：单击右下角的文件，然后选择“导入数据集” 然后发生了奇怪的事情：当我选择“第一行作为名称”时，姓氏会正确显示日语但是当我禁用它时，它显示不正确。

enter image description here 谁能帮助我正确导入日本csv？非常感谢！

Answer 1

使用fileEncoding =“ UTF-8”而不是encoding =“ UTF-8”。