应用错误收集

关于短信的关联学习

时间：2012-10-20 08:31:47

标签： associations machine-learning

我有一个包含发件人姓名，收件人，一个单词和二十个单词之间的短消息的短消息数据集，以及一个分配垃圾邮件/非垃圾邮件的类。我想基于这些历史数据构建一组关联规则。我正在考虑Apriori算法但我不知道如何离散短消息以便在数据集上运行算法。目标是提取导致垃圾邮件/非垃圾邮件分类的规则

1 个答案:

答案 0 :(得分：1)

Naive Bayes / SVM对于这种分类更好。只需将每个单词视为一个功能。