我正在尝试导入R文本文件,用 TextWrangler 保存为Unicode(UTF-8)和Unix(LF)
以下是我正在使用的代码:
scan("Testi/PIRANDELLOsigira.txt", fileEncoding='UTF-8', what=character(), sep='\n')
我收到了以下警告:
Read 6 items
Warning message:
In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
invalid input found on input connection 'Testi/PIRANDELLOsigira.txt'
和一个停在第一个重音字符处的矢量。
答案 0 :(得分:1)
首先将您的语言区域从意大利更改为英语
Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")
然后您可以使用意大利语编码
读取数据df_ch <- read.table("test.utf8",
sep=",",
header=TRUE,
encoding=" Italian",
)
如果您只想使用UTF-8编码读取数据 你可以简单地使用以下
yourdf <- read.table(" path to your data.utf8",
sep=",",
header=TRUE,
encoding="UTF-8",
)