R不接受某些具有变音符号的塞尔维亚字符(č,ć)

时间:2016-06-17 16:44:32

标签: r encoding

塞尔维亚字母在英文字母表上另外加上5个字母(š,đ,ž,č,ć)。问题是R不会承认č和ć。字符š,đ和ž工作正常,但每当我尝试使用č和ć时,R将它们解释为c。

>š
Error: object 'š' not found
>ž
Error: object 'ž' not found
>đ
Error: object 'd' not found
>č
function (..., recursive = FALSE)  .Primitive("c")
>ć
function (..., recursive = FALSE)  .Primitive("c")

当我将文件读入R时,它总是用c代替č和ć。

有什么方法吗?

>Sys.getlocale()
[1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252"

1 个答案:

答案 0 :(得分:1)

将系统区域设置更改为特定语言可能会有所帮助。使用" UTF-8"格式应保留特殊字符 当你阅读

  read.table("file.txt",encoding="UTF-8")

如果您正在编写文件,则可以执行此类操作

  con <- file("path/filename.txt", encoding = "UTF-8")
  write(x, file = con)