在R中导入UTF-8文本文件(带有意大利语重音符号)

时间:2015-03-01 11:18:44

标签: r unicode utf-8

我正在尝试导入R文本文件,用 TextWrangler 保存为Unicode(UTF-8)和Unix(LF)

以下是我正在使用的代码:

scan("Testi/PIRANDELLOsigira.txt", fileEncoding='UTF-8', what=character(), sep='\n')

我收到了以下警告:

 Read 6 items
 Warning message:
 In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  :
 invalid input found on input connection 'Testi/PIRANDELLOsigira.txt'

和一个停在第一个重音字符处的矢量。

1 个答案:

答案 0 :(得分:1)

首先将您的语言区域从意大利更改为英语

Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")

然后您可以使用意大利语编码

读取数据
df_ch <- read.table("test.utf8",
                     sep=",",
                     header=TRUE, 
                     encoding=" Italian", 
                     )

如果您只想使用UTF-8编码读取数据 你可以简单地使用以下

yourdf <- read.table(" path to your data.utf8",
                        sep=",",
                        header=TRUE, 
                        encoding="UTF-8", 
                        )