反垃圾邮件过滤器,列出问题

时间:2016-10-24 08:38:30

标签: python list label filtering bayesian

早上好,我需要一个帮助..我正在尝试为我的毕业论文编写一个垃圾邮件过滤器..我已经反驳了列表中电子邮件词语的频率..现在我应该从中提取功能发送电子邮件并将其与电子邮件类标签(“垃圾邮件”或“火腿”)配对。但是没有输出,我需要一个其他的解决方案,用这些词语的频率对这个标签进行分类。我只发布了代码的最后部分和频率,并尝试了这些频率。在文本时间我将使用NaivebayesianFilter ...抱歉我的英语不好..提前致谢!

ps = PorterStemmer()
i = 0
while i < 5174:
    emails[i]=[[ps.stem(parola) for parola in sentence.split(" ")] for sentence in emails[i]]
    i=i+1


print(emails[1])
i = 0
while i < 5174:
    frequenzeparole[i]= Counter(elem[0] for elem in emails[i])
    i=i+1

i = 0
while i < 5174:
    all_features =[ (frequenzaparole[i], spam) for (frequenzaparole[i], spam) in emails[i]]
    i=i+1

0 个答案:

没有答案