vectorizer = TfidfVectorizer(sublinear_tf=True, max_df=0.5,stop_words='english',use_idf=True, ngram_range =(2,2))
当使用ngram = 2实现TFIDF时,我的jupyter笔记本的内核会不断重新启动。无论如何,有没有有效运行它的方法,因此内核不会崩溃。
我也尝试在VScode中运行它,并说“ zsh:杀死了/ opt / anaconda3 / bin / python”
数据集非常大(大约5000条记录,每条记录中都有一串String)