非英语术语文档矩阵

时间:2019-02-26 16:46:11

标签: python term-document-matrix

我想在python中为阿拉伯语言构造一个Term-Document矩阵,我使用了CountVectorizer(),但它在列中提供了文档,在行中提供了术语。我希望这些术语位于列中,文档位于行中,我试图转置矩阵,但是它给出了错误的值,这是我使用的代码。

corpus = [ 'القدرة على التفكير و الحل', 'القدرة على التعلم و القدرة على التفكير في المسائل', 'القدرة على التعلم في حل المسائل']
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(corpus)
v = X.toarray()

0 个答案:

没有答案