我如何看待NLTK分类器训练方法

时间:2018-05-21 16:25:05

标签: nltk

我一直在关注Laurent Luce关于情绪分析的博客。不幸的是我无法关注他的博客,所以我不能直接问他一个问题。以下是博客的链接:http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/

几乎所有东西都很好用。但是,我无法弄清楚如何使这部分工作 - 下面的文字是从链接粘贴的。我的问题是如何查看分类器训练方法?如果我能做到这一点,这将有助于我理解。

“让我们看一下NLTK库源代码中的分类器训练方法.'label_probdist'是每个标签的先验概率,'feature_probdist'是特征/值概率字典。使用这两个概率对象创建分类器。“

def train(labeled_featuresets, estimator=ELEProbDist):
...
# Create the P(label) distribution
label_probdist = estimator(label_freqdist)
...
# Create the P(fval|label, fname) distribution
feature_probdist = {}
...
return NaiveBayesClassifier(label_probdist, feature_probdist)

1 个答案:

答案 0 :(得分:0)

NLTK是开源的。您可以找到源代码here。 Github具有可靠的搜索功能,因此您应该能够使用它找到您需要的任何内容。具体来说,朴素贝叶斯分类器是here 你可以在那个文件中看到它的列车方法。