Question

我一直在关注Laurent Luce关于情绪分析的博客。不幸的是我无法关注他的博客，所以我不能直接问他一个问题。以下是博客的链接：http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/

几乎所有东西都很好用。但是，我无法弄清楚如何使这部分工作 - 下面的文字是从链接粘贴的。我的问题是如何查看分类器训练方法？如果我能做到这一点，这将有助于我理解。

“让我们看一下NLTK库源代码中的分类器训练方法.'label_probdist'是每个标签的先验概率，'feature_probdist'是特征/值概率字典。使用这两个概率对象创建分类器。“

def train(labeled_featuresets, estimator=ELEProbDist):
...
# Create the P(label) distribution
label_probdist = estimator(label_freqdist)
...
# Create the P(fval|label, fname) distribution
feature_probdist = {}
...
return NaiveBayesClassifier(label_probdist, feature_probdist)

Answer 1

NLTK是开源的。您可以找到源代码here。 Github具有可靠的搜索功能，因此您应该能够使用它找到您需要的任何内容。具体来说，朴素贝叶斯分类器是here 你可以在那个文件中看到它的列车方法。

我如何看待NLTK分类器训练方法

1 个答案: