重要变量的数据挖掘(数值):从哪里开始?

时间:2011-09-25 14:00:13

标签: statistics machine-learning data-mining rapidminer

我在外汇市场上有一个我试图改进的交易策略。

我有一张巨大的表(100k +行)代表市场上每一种可能的交易,交易类型(买入或卖出),交易结束后的盈利/亏损,以及代表各种市场的10个左右的额外变量贸易开放时的衡量标准。

我试图找出这10个变量中的任何一个是否与利润/损失显着相关。

例如,假设变量X的范围是50到-50。 买单的X平均值为25,卖单的平均值为-25。

如果最有利可图的买单的价值为X> 25,最有利可图的卖单具有X< -25然后我会认为X-to-profit的关系很重要。

我想为此提供一个很好的起点。我安装了RapidMiner 5,以防有人可以给我一个具体的建议。

1 个答案:

答案 0 :(得分:14)