应用错误收集

我有一个具有8个功能的DataFrame，其中之一是文本功能。我想应用NLP技术并使用CountVectorizer创建一个词袋。我的问题是，在建模之前，我如何保留“词袋”矩阵中的所有其他7个功能？

from sklearn.feature_extraction.text import CountVectorizer

cv = CountVectorizer()
cv.fit(reviews_train_clean)
X = cv.transform(reviews_train_clean)

目前，我的X矩阵只是单词袋，而我想要的是单词袋和其他功能（例如年龄，工资...）