我正在对阿拉伯语进行情感分析,我想创建自己的语料库,为此,我从Facebook收集300状态并将其分类为正面和负面,现在我想做标记化这些状态,为了获得一个单词列表,并且hen生成unigrams和bigrams,trigrams并使用交叉折叠验证,我现在正在使用nltk python,这个软件能够用阿拉伯语进行这个任务吗或者说剑人Minner会更好地合作,你觉得怎么样?我想知道如何生成双字母组,三元组并使用交叉折叠验证,有什么想法吗?
答案 0 :(得分:0)
嗯,我认为快速通道非常有趣,可以处理这个任务。它包含几个处理文本挖掘的运算符。此外,它还允许创建具有高流畅度的新运算符。