我正在使用scikit-learn来创建tf-idf。所以,这是我正在做的事情的摘录:
def create_tm(content):
vectorizer = CountVectorizer(stop_words=stopWords,min_df=1)
transformer = TfidfTransformer()
tdm = vectorizer.fit_transform(content)
trainVectorizerArray = tdm.toarray()
X_tfidf = transformer.fit_transform(trainVectorizerArray)
Dict = vectorizer.vocabulary_
return (tdm, X_tfidf, Dict)
这是我的问题 - 是否可以强制矩阵索引值从1开始而不是0?