labelTrainData.csv用于训练分类器以预测Testdata.csv的情绪。最后我得到了BagOfCentroids.csv。
labelTrainData.csv
id sentiment Tweet
1 0 tweet_1
2 1 tweet_2
3 0 tweet_3
Testdata.csv
id Tweet
1 tweet_1
2 tweet_2
3 tweet_3
BagOfCentroids.csv
id sentiment
1 0
2 1
3 1
要计算上述指标,我正在尝试这个,
print 'Sentiment precision:'
nltk.metrics.precision(BagOfCentroids['sentiment'], Testdata['sentiment'])
print 'sentiment recall:'
nltk.metrics.recall(BagOfCentroids['sentiment'], Testdata['sentiment'])
print 'sentiment F-measure:'
nltk.metrics.f_measure(BagOfCentroids['sentiment'], Testdata['sentiment'])
有没有办法计算精确度,召回率和F值?
答案 0 :(得分:0)
这篇文章会有所帮助:
TEXT CLASSIFICATION FOR SENTIMENT ANALYSIS – PRECISION AND RECALL
Detail about nltk.metrics package
这可能是因为某些导入问题