在CountVectorizer之后保留所有功能

时间:2019-04-02 08:01:37

标签: python machine-learning nlp

我有一个具有8个功能的DataFrame,其中之一是文本功能。我想应用NLP技术并使用CountVectorizer创建一个词袋。我的问题是,在建模之前,我如何保留“词袋”矩阵中的所有其他7个功能?

from sklearn.feature_extraction.text import CountVectorizer

cv = CountVectorizer()
cv.fit(reviews_train_clean)
X = cv.transform(reviews_train_clean)

目前,我的X矩阵只是单词袋,而我想要的是单词袋和其他功能(例如年龄,工资...)

0 个答案:

没有答案