我是WEKA和ML的新手,所以请原谅我对以下内容的无知。我浪费了几个小时试图弄明白,所以希望有人可以指出我正确的方向:
我正在尝试为USDJPY运行J48决策树。数据是通过.csv文件加载的,类值是名义类型,更具体地说,如果USDJPY在20个交易日后交易价格上涨超过1%,则值为TRUE或FALSE。问题是,当我运行算法时,决策树只是使用类值来解决问题,这是无用的。除了class属性之外还有* 22个属性,我希望从中预测类属性。
将我的数据集与示例“玻璃”数据集进行比较时,我发现两者之间没有任何区别可以解释我的问题。当我运行J48(具有相同的设置)时,“glass.arff”按预期工作,试图通过其他属性预测类值(玻璃类型)(即它得到一些猜测错误)。
我在这里缺少什么?这是一个属性列表:
@ATTRIBUTE date NUMERIC
@ATTRIBUTE open NUMERIC
@ATTRIBUTE high NUMERIC
@ATTRIBUTE low NUMERIC
@ATTRIBUTE close NUMERIC
@ATTRIBUTE 1daypctchg NUMERIC
@ATTRIBUTE smavg50onclose NUMERIC
@ATTRIBUTE smavg100onclose NUMERIC
@ATTRIBUTE smavg200onclose NUMERIC
@ATTRIBUTE ubb2 NUMERIC
@ATTRIBUTE bollma2 onclose NUMERIC
@ATTRIBUTE lbb2 NUMERIC
@ATTRIBUTE bollwjpybgn NUMERIC
@ATTRIBUTE %bjpybgn NUMERIC
@ATTRIBUTE rsi NUMERIC
@ATTRIBUTE ma50>100 {FALSE,TRUE}
@ATTRIBUTE ma50>200 {FALSE,TRUE}
@ATTRIBUTE ma100>200 {FALSE,TRUE}
@ATTRIBUTE up1pct5d? {FALSE,TRUE}
@ATTRIBUTE up1pct20d? {FALSE,TRUE}
@ATTRIBUTE dwn1pct5d? {FALSE,TRUE}
@ATTRIBUTE dwn1pct20d? {FALSE,TRUE}
答案 0 :(得分:1)
Weka(及其J48实现)应该能够对您的数据进行分类,只要地面实况类始终位于.csv文件的同一列中。