基于单词列表Python的分类

时间:2014-06-12 21:24:57

标签: python mongodb classification words

我想对文字进行分类:正面,负面或中性。我有一个积极和消极的单词列表。我想用Python做。在这里我用这种代码描述

  

如果在positive_words中找到文字中的单词   counterpos = pos_count [i] + = 1

     

如果在negative_words中找到文字中的单词   counterneg = neg_count [i] + = 1

     

totalcount = pos_count + neg_count

     

if(len(totalcount)> 0):       存储在正数据库中   elif(len(totalcount)< 0):       存储在否定数据库中:

store in neutral database

这是一般的想法,我的编码可行性为空。 我存储在mongodb,以便我没有问题存储。我仍然无法进行分类。 有人可以帮帮我吗。

1 个答案:

答案 0 :(得分:0)

除了字符串比较和控制流语句外,list comprehension在这里也很有用。

text = "seeking help on possible homework task"
raw_words = text.split(" ")

positive_words = ['seeking','help']
negative_words = ['homework']

positive_score = len([word for word in raw_words if word in positive_words])
negative_score = len([word for word in raw_words if word in negative_words])

total_score = positive_score - negative_score

这会导致total_score的值为1