标签: machine-learning classification weka document-classification
重复:How to represent text for classification in weka?
如果我的数据是电子邮件,即文本数据,分类器的输入是什么?电子邮件中的属性/功能集应该考虑根据讨论主题进行分类?
答案 0 :(得分:0)
通常,使用TF-IDF将输入数据转换为稀疏向量。