标签: filter weka document-classification
我的数据通过StringToWordVector过滤器传递。 StringToWordVector可以输出二进制存在/不存在指示符,字频率或TF-IDF分数。 weka下这个过滤器的默认输出是什么?
答案 0 :(得分:2)
根据此documentation中指定的选项,
-C Output word counts rather than boolean word presence.
默认输出是布尔字存在,可以通过传递-C等参数来更改。
-C