Question

我正在寻找一种方法来对2个班级的正面句子或文本进行分类：正面课程和非常积极的课程。

使用marchine学习方法

你有什么想法吗？

提前致谢

Answer 1

这取决于你想要的动手。您可以使用Natural Language Toolkit或TextBlob，这是一个非常简单的程序包，建议用于简单的情况。

This页面解释了NLTK如何处理事情，this page应该让您启动并运行TextBlob。

Answer 2

由于您使用的是机器学习方法，我建议使用'from reverend.thomas import Bayes'，如下所示：

from reverend.thomas import Bayes
class = Bayes()
#Train your data by traversing 
with open('positive.txt', 'r') as f:
    line = f.read()
    class.train('positive', line)
with open('very_positive.txt', 'r') as f:
    line = f.read()
    class.train('very_positive', line)
for phrase in testing_data:
    c = class.guess(phrase)
    print phrase, '-->', c

Answer 3

由于您提到您没有具有非常正面标签的数据集。您可以按如下方式使用列表组合（您需要根据您的选择和数据更新列表中的单词）：

positive = ['good', 'nice']
very_positive = ['great', 'amazing', 'brilliant']
if any(word in data for word in very_positive):
    print 'Very Positive!'
elif any(word in data for word in positive):
    print 'Positive!'
else:
    print "Can't Classify"

希望这会有所帮助。

将文本或句子分为两类：积极或非常积极的蟒蛇

3 个答案: