Weka属性日期不起作用

时间:2015-06-17 21:56:30

标签: date weka

我使用属性date:

创建了一个.arff文件

@attribute数据日期“yyyy-MM-dd”

还有其他属性。

数据的一个例子是:

@data

“2014年1月2日”,11.27,11.44,11.03,11.18,11.07,11.07,11.12,9419,2003400,2240946600,1

然而,Weka似乎没有认识到日期属性。那是因为当我查看图形(来自日期属性)时,轴x的边距(与日期相对应)从1388628000000开始,到1419904800000结束,这根本没有意义。

当我尝试分类时,分类器(我使用J48树和SVM进行测试)只需要一个类和自尊到整个测试集。显然是错的,我相信这是因为日期属性。

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

通过一些研究,我独立发现了与你的问题有关的东西。看看它是否对你有帮助。

https://stackoverflow.com/questions/32738822/weka-doesnt-differentiate-between-date-and-numeric-attributes-features

最严重的问题是一些Weka算法(超过期望值)根本不接受日期属性。

修改

当比较date和numeric类型的两个属性时,Weka不区分它们,也就是说,date属性将其类型返回为numeric,因此,当它们不是正确的答案时,它们具有重合类型。如果你检查日期属性,它是从Weka查看的日期用于某些目的,但在内部,Weka将日期视为一个数字(从参考日期开始的毫秒数,如果我是对的)。问题是从用户的角度来看,它不是同一类型的属性,应该指出它。

我一直在考虑将日期转换为数字(可能通过过滤器),但日期的固有信息能力将毫无意义。

另一种方法涉及将日期属性转换为多个数字+名义属性,例如:年,月,日,周,星期几。