将文本或句子分为两类:积极或非常积极的蟒蛇

时间:2018-04-17 15:28:05

标签: python python-3.x python-2.7

我正在寻找一种方法来对2个班级的正面句子或文本进行分类:正面课程和非常积极的课程。

使用marchine学习方法

你有什么想法吗?

提前致谢

3 个答案:

答案 0 :(得分:0)

这取决于你想要的动手。您可以使用Natural Language ToolkitTextBlob,这是一个非常简单的程序包,建议用于简单的情况。

This页面解释了NLTK如何处理事情,this page应该让您启动并运行TextBlob。

答案 1 :(得分:0)

由于您使用的是机器学习方法,我建议使用'from reverend.thomas import Bayes',如下所示:

from reverend.thomas import Bayes
class = Bayes()
#Train your data by traversing 
with open('positive.txt', 'r') as f:
    line = f.read()
    class.train('positive', line)
with open('very_positive.txt', 'r') as f:
    line = f.read()
    class.train('very_positive', line)
for phrase in testing_data:
    c = class.guess(phrase)
    print phrase, '-->', c

答案 2 :(得分:0)

由于您提到您没有具有非常正面标签的数据集。您可以按如下方式使用列表组合(您需要根据您的选择和数据更新列表中的单词):

positive = ['good', 'nice']
very_positive = ['great', 'amazing', 'brilliant']
if any(word in data for word in very_positive):
    print 'Very Positive!'
elif any(word in data for word in positive):
    print 'Positive!'
else:
    print "Can't Classify"

希望这会有所帮助。