我看过一个代码演示,该示例演示了我们可以通过使用.A属性来返回稀疏矩阵的密集数组。这比toarray()方法更有效吗?
我正在查看的演示代码是NLP教学模块的一部分。它演示了scikit-learn中TfidfVectorizer的用法。我在输入数据上附加了一些简化的代码。
我对.A属性不熟悉,感到惊讶的是它也可能返回密集数组。因此,我想知道是否可以继续使用此属性。
from sklearn.feature_extraction.text import TfidfVectorizer
X_train = ['This is fake', 'This is also fake', 'This is real', 'Pretty much as real as can be']
y_train = [0, 0, 1, 1]
tfidf_vectorizer = TfidfVectorizer(stop_words='english')
tfidf_train = tfidf_vectorizer.fit_transform(X_train)
print(tfidf_vectorizer.get_feature_names())
print(tfidf_train.A)