在R-中没有显示的阿拉伯文字

时间:2017-03-28 11:14:13

标签: r nlp arabic tm

我打算用阿拉伯语开始使用R,因为我打算用Hadith语料库进行文本分析和文本挖掘。我一直在阅读与我的问题相关的线索,但是,仍然无法在这里获得真正的基础知识(抱歉,绝对是初学者)。

所以,我输入了: textarabic.v< - scan(" data / arabic-text.txt",encoding =" UTF-8",what =" character",sep =& #34; \ n&#34)

当然textarabic.v出现的是符号(pic)。在此之前,当我在一个帖子中阅读时,我将文本保存在utf-8中,但仍然没有用阿拉伯语显示。

我可以输入阿拉伯语R但是扫描会将文本带入符号中。

enter image description here

同时阅读并尝试实现其他用户的代码以使阿拉伯语文本功能,但我甚至不知道如何以及在何处实施它们。 我添加了R,tm和NLP包。

你建议我接下来做什么? 提前谢谢,

1 个答案:

答案 0 :(得分:0)

我刚刚发布了一个答案,说你必须在Windows上使用R才能看到你在OSX上的评论。在OSX上,情况并不那么可怕。问题是你使用的R版本太旧了。如果我没记错的话,3.2之前的任何东西都不能正确处理Unicode。尝试从https://cran.r-project.org/bin/macosx/安装3.3.3,如有必要,请重新安装所需的软件包。那你应该没问题。 بالتوفيق!