我正在寻找一种方法来对2个班级的正面句子或文本进行分类:正面课程和非常积极的课程。
使用marchine学习方法
你有什么想法吗?
提前致谢
答案 0 :(得分:0)
这取决于你想要的动手。您可以使用Natural Language Toolkit或TextBlob,这是一个非常简单的程序包,建议用于简单的情况。
答案 1 :(得分:0)
由于您使用的是机器学习方法,我建议使用'from reverend.thomas import Bayes',如下所示:
from reverend.thomas import Bayes
class = Bayes()
#Train your data by traversing
with open('positive.txt', 'r') as f:
line = f.read()
class.train('positive', line)
with open('very_positive.txt', 'r') as f:
line = f.read()
class.train('very_positive', line)
for phrase in testing_data:
c = class.guess(phrase)
print phrase, '-->', c
答案 2 :(得分:0)
由于您提到您没有具有非常正面标签的数据集。您可以按如下方式使用列表组合(您需要根据您的选择和数据更新列表中的单词):
positive = ['good', 'nice']
very_positive = ['great', 'amazing', 'brilliant']
if any(word in data for word in very_positive):
print 'Very Positive!'
elif any(word in data for word in positive):
print 'Positive!'
else:
print "Can't Classify"
希望这会有所帮助。