我有一个日语文本csv文件,由制表符分隔 它是使用python csv包以utf-8编写的 但是,当我使用如下命令在RStudio中将其导入时
A <- read.csv("reviews4.csv",sep="\t",header = F,encoding="UTF-8")
日语字符将显示如下:
<U+8AAC>明無<U+3057><U+306B><U+5185>容量<U.....
我认为它只能正确显示汉字部分。
我尝试编码=“ CP932” 它会显示: 隤祆<98><81><86>嗒<87><....
然后,我尝试了另一种方法:单击右下角的文件,然后选择“导入数据集” 然后发生了奇怪的事情: 当我选择“第一行作为名称”时,姓氏会正确显示日语 但是当我禁用它时,它显示不正确。
谁能帮助我正确导入日本csv? 非常感谢!
答案 0 :(得分:1)
使用fileEncoding =“ UTF-8”而不是encoding =“ UTF-8”。