读R中的阿拉伯数据文本和plot()

时间:2014-01-20 16:03:19

标签: r text arabic

R似乎没有很好地处理阿拉伯语文本。虽然可以键入一些像

这样的阿拉伯字符串
Names <- c("سليم", "سعيد", "مجدى").

现在我使用word或excel来编写更长的名称列表并将文件另存为文本。我可以在R(RStudio)中导入文件并正确显示导入的数据。但是,我无法操纵导入的列表。例如,绘图会产生有趣的人物。为什么直接输入列表(根本不容易)可以绘制而不是导入列表?

我正在使用Windows 7,R v.3.0.2和RStudio来读取文件。

任何有关在R中使用阿拉伯语文本的帮助将不胜感激。 感谢

1 个答案:

答案 0 :(得分:7)

如果您使用编码'UTF-8'保存文本(例如使用Rstudio创建文本文件,然后从菜单中使用“使用编码保存...”并选择UTF-8),那么您可以阅读它容易:

readLines('d:/temp/arabic.txt',encoding='UTF-8')
[1] "\"سليم\" \"سعيد\" \"مجدى\""

或使用scan

scan("arabic",encoding='UTF-8',what='character',sep=',')
Read 3 items
[1] "سليم"    " سعيد"   " مجدى  "