错误:9适合sklearn.naive_bayes.MultinomialNB()

时间:2017-12-06 13:29:47

标签: scikit-learn classification feature-extraction text-classification countvectorizer

在使用TfidfCountvectorizer拟合多项式朴素贝叶斯分类器时,我被杀死了:9错误

def classify(vector, df):
    clf = MultinomialNB()
    model = clf.fit(vector, df.iloc[0:, 1].values)

if __name__ == "__main__":
    train, test = gen_train_test(pd.read_csv('Data/datalabel.csv'))
    vector = joblib.load('Data/tf.pkl')
    classify(vector, train, name='mnb')
    print('Program executed!')

这里,火车的大小为409MB,矢量大小为20.3GB。

我使用的是MacBook Pro-13 2017,8GB RAM,256 GB SSD。

1 个答案:

答案 0 :(得分:0)

代码中的这个简单修改解决了问题

vector = joblib.load(open('Data/tf.pkl', 'rb'))