为什么WEKA将数据视为属性?

时间:2019-05-19 07:28:17

标签: machine-learning nlp weka text-classification

我正在尝试预测给定字符串的类别。以下是我拥有(已编辑)的arff文件的示例

@ATTRIBUTE Text string
@ATTRIBUTE class {type1,type2,type3}
@DATA
"Data for type1" type1
"Data for type2" type2
"Data for type3" type3
"Data for type3" type3 
"Data for type1" type1 
"Data for type2" type2

我认为以上集合中的属性为“文本”和“类”。但是,程序会将“数据”中的每个工作都识别为属性。这是预期的吗?

Enumeration<Attribute> attributeEnumeration =   dataset.enumerateAttributes();
while(attributeEnumeration.hasMoreElements()){
            Attribute attribute = attributeEnumeration.nextElement();
            LOGGER.info("attr name"+attribute.name());

        }

我正在与

一起关注weka文档

https://www.codingame.com/playgrounds/6734/machine-learning-with-java---part-5-naive-bayes https://github.com/nsadawi/WEKA-API/tree/master/src

谢谢, 杰伊

0 个答案:

没有答案