标签: associations machine-learning
我有一个包含发件人姓名,收件人,一个单词和二十个单词之间的短消息的短消息数据集,以及一个分配垃圾邮件/非垃圾邮件的类。我想基于这些历史数据构建一组关联规则。我正在考虑Apriori算法但我不知道如何离散短消息以便在数据集上运行算法。目标是提取导致垃圾邮件/非垃圾邮件分类的规则
答案 0 :(得分:1)
Naive Bayes / SVM对于这种分类更好。只需将每个单词视为一个功能。