我一直在尝试不同的模式匹配,分析和预测时间序列数据的方法。
由于我没有数据挖掘或相关领域的专业经验,所以我从头开始提出自己的方法。
经过几个月的零星挖掘数据挖掘文章(我理解的几篇)后,我意识到我的方法非常基础。
例如,我实现模式匹配的方式是通过多维k-Nearest Neighbor方法。
我现在才刚刚开始明白,我应该利用决策树,主成分分析,协变矩阵等常用技术。
我一直在尝试使用RapidMiner,这是一个GUI数据挖掘工具。 RapidMiner允许您拖放各种复杂技术的实现,并将它们连接在一起,而无需编写一行代码。它对我来说是一个很棒的学习工具。 它看起来像这样:
RapidMiner有一个API,但遗憾的是它是Java版本,我目前的所有代码都是Free Pascal和MySQL。
我正在寻找将RapidMiner集成到我的应用程序中的一些方法,因此我可以通过RapidMiner GUI尝试不同的数据处理方法,并将它与我当前的代码无缝地结合使用。
如果这不可行,我会选择另一个数据挖掘包,只要它很容易集成到我当前的Free Pascal代码中。
我调查了R - 这似乎是正确的,但与Free Pascal集成似乎并不容易。
为清楚起见,我的数据集相当大(500,000多行),并且计算必须实时进行。该软件在Windows 7上运行。
答案 0 :(得分:2)
我不知道这个包,但是有一些通用选项: