我一直在关注Laurent Luce关于情绪分析的博客。不幸的是我无法关注他的博客,所以我不能直接问他一个问题。以下是博客的链接:http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/
几乎所有东西都很好用。但是,我无法弄清楚如何使这部分工作 - 下面的文字是从链接粘贴的。我的问题是如何查看分类器训练方法?如果我能做到这一点,这将有助于我理解。
“让我们看一下NLTK库源代码中的分类器训练方法.'label_probdist'是每个标签的先验概率,'feature_probdist'是特征/值概率字典。使用这两个概率对象创建分类器。“
def train(labeled_featuresets, estimator=ELEProbDist):
...
# Create the P(label) distribution
label_probdist = estimator(label_freqdist)
...
# Create the P(fval|label, fname) distribution
feature_probdist = {}
...
return NaiveBayesClassifier(label_probdist, feature_probdist)