我使用属性date:
创建了一个.arff文件@attribute数据日期“yyyy-MM-dd”
还有其他属性。
数据的一个例子是:
@data
“2014年1月2日”,11.27,11.44,11.03,11.18,11.07,11.07,11.12,9419,2003400,2240946600,1
然而,Weka似乎没有认识到日期属性。那是因为当我查看图形(来自日期属性)时,轴x的边距(与日期相对应)从1388628000000开始,到1419904800000结束,这根本没有意义。
当我尝试分类时,分类器(我使用J48树和SVM进行测试)只需要一个类和自尊到整个测试集。显然是错的,我相信这是因为日期属性。
我该如何解决这个问题?
答案 0 :(得分:1)
通过一些研究,我独立发现了与你的问题有关的东西。看看它是否对你有帮助。
最严重的问题是一些Weka算法(超过期望值)根本不接受日期属性。
修改强>
当比较date和numeric类型的两个属性时,Weka不区分它们,也就是说,date属性将其类型返回为numeric,因此,当它们不是正确的答案时,它们具有重合类型。如果你检查日期属性,它是从Weka查看的日期用于某些目的,但在内部,Weka将日期视为一个数字(从参考日期开始的毫秒数,如果我是对的)。问题是从用户的角度来看,它不是同一类型的属性,应该指出它。
我一直在考虑将日期转换为数字(可能通过过滤器),但日期的固有信息能力将毫无意义。
另一种方法涉及将日期属性转换为多个数字+名义属性,例如:年,月,日,周,星期几。