创建阿拉伯语语料库

时间:2013-03-07 21:42:29

标签: python nlp nltk sentiment-analysis rapidminer

我正在对阿拉伯语进行情感分析,我想创建自己的语料库,为此,我从Facebook收集300状态并将其分类为正面和负面,现在我想做标记化这些状态,为了获得一个单词列表,并且hen生成unigrams和bigrams,trigrams并使用交叉折叠验证,我现在正在使用nltk python,这个软件能够用阿拉伯语进行这个任务吗或者说剑人Minner会更好地合作,你觉得怎么样?我想知道如何生成双字母组,三元组并使用交叉折叠验证,有什么想法吗?

1 个答案:

答案 0 :(得分:0)

嗯,我认为快速通道非常有趣,可以处理这个任务。它包含几个处理文本挖掘的运算符。此外,它还允许创建具有高流畅度的新运算符。