如何应用stringtoword矢量滤波器

时间:2014-05-12 18:45:04

标签: filter weka options

我正在尝试使用weka gui对一些文本数据进行分类。

我正在使用stringtoword过滤器,其属性indices default value设置为first-last。

然而,我试图将其改为诸如1,500之后的事情

它给出了无效范围列表的错误。

最初我的arff只有2个属性。

class
text

我有什么不对的吗?

我很确定文本文件中有很多单词,当我运行first-last的默认过滤器时,它会给我一整个10,000个属性

1 个答案:

答案 0 :(得分:1)

属性索引采用索引,分别是要转换为单词向量的属性的索引。因此,您有两个属性类,索引为1,文本为索引2。 设置first-last需要两者并且很可能对类没有任何作用,因为它通常是单值,并从属性文本生成一个单词向量。

切入追逐,在这种情况下,你唯一的选择是使用2或倒数第一,但结果将是相同的。 500超出范围,因为您只有2个属性。

PS。如果您希望仅使用获得的单词向量中的单词范围,则可以使用“删除”过滤器并指定要删除的列(单词)的索引...