R无法识别阿拉伯语

时间:2019-04-16 09:16:16

标签: r utf-8 text-mining

我正在使用R中的阿拉伯语数据,因此我将本地阿拉伯语设置如下所示 Sys.setlocale("LC_CTYPE","arabic")

然后我打开数据并将其分配给变量,我可以清晰地读取它,但是当我处理它时,控制台栏上的结果变成了符号,无法理解它

ظ…ط¨ط§ظ„ط؛ ظپظٹظ‡ط§

这是我第一次遇到这个问题有帮助吗?

1 个答案:

答案 0 :(得分:0)

我认为“阿拉伯语”不是正确的语言环境,因此您不能将其设置为LC_CYPE

正常格式为:en_US.UTF-8,因此语言,国家/地区和现在相当标准的后缀.UTF-8UTF8用于指定编码。

您应该在终端上使用locale -a来找到计算机上可用的语言环境。阅读操作系统文档,了解如何添加新的语言环境(对于Windows,以及如何在https://superuser.com/上,对于Unix和Linux(Ubuntu也具有自己的堆栈交换站点),如何添加https://unix.stackexchange.com/) MacO。

但是我认为您误解了语言环境。语言环境是关于系统应如何与您交互的。它与您正在使用的数据无关。但是用于排序(R使用语言环境)并显示。