我有一个具有8个功能的DataFrame,其中之一是文本功能。我想应用NLP技术并使用CountVectorizer创建一个词袋。我的问题是,在建模之前,我如何保留“词袋”矩阵中的所有其他7个功能?
from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer()
cv.fit(reviews_train_clean)
X = cv.transform(reviews_train_clean)
目前,我的X矩阵只是单词袋,而我想要的是单词袋和其他功能(例如年龄,工资...)