如何使用weka基于讨论主题将电子邮件数据表示为分类输入?

时间:2012-01-05 11:18:39

标签: machine-learning classification weka document-classification

  

重复:How to represent text for classification in weka?

如果我的数据是电子邮件,即文本数据,分类器的输入是什么?电子邮件中的属性/功能集应该考虑根据讨论主题进行分类?

1 个答案:

答案 0 :(得分:0)

通常,使用TF-IDF将输入数据转换为稀疏向量。