我正在尝试使用weka gui对一些文本数据进行分类。
我正在使用stringtoword过滤器,其属性indices default value设置为first-last。
然而,我试图将其改为诸如1,500之后的事情
它给出了无效范围列表的错误。
最初我的arff只有2个属性。
class
text
我有什么不对的吗?
我很确定文本文件中有很多单词,当我运行first-last的默认过滤器时,它会给我一整个10,000个属性
答案 0 :(得分:1)
属性索引采用索引,分别是要转换为单词向量的属性的索引。因此,您有两个属性类,索引为1,文本为索引2。 设置first-last需要两者并且很可能对类没有任何作用,因为它通常是单值,并从属性文本生成一个单词向量。
切入追逐,在这种情况下,你唯一的选择是使用2或倒数第一,但结果将是相同的。 500超出范围,因为您只有2个属性。
PS。如果您希望仅使用获得的单词向量中的单词范围,则可以使用“删除”过滤器并指定要删除的列(单词)的索引...