Datamining开源软件替代品

时间:2008-10-28 12:03:57

标签: open-source data-mining

我正在评估数据挖掘包。
到目前为止我找到了这两个:

  • RapidMiner
  • Weka
  • 您是否有经验与这两种产品或任何其他产品分享推荐给我?
    感谢

    10 个答案:

    答案 0 :(得分:10)

    根据2007年,2008年和2009年的年度KDnuggets民意调查,RapidMiner是全球数据挖掘专家中使用最广泛的开源数据挖掘解决方案: KDnuggets Data Mining Tool Poll 2009

    RapidMiner是开源的100%Java,RapidMiner比Weka和KNIME更灵活,功能更多。

    关于SVM实现:Weka带有一个这样的实现(LibSVM),而RapidMiner提供了四个SVM实现(LibSVM,MySVM,EvoSVM,SMO-SVM),其中一些具有更高级的功能。

    答案 1 :(得分:5)

    另一种选择是Orange。它包括各种算法和数据挖掘技术,您可以直接通过Python脚本或通过GUI访问它们。

    答案 2 :(得分:2)

    Pentaho适合商业智能。所以也许你想看看它。我有一些经验,主要是数据仓库,非常高兴。

    答案 3 :(得分:2)

    直接在R!

    中重新发明轮子和代码

    答案 4 :(得分:2)

    如果您对与频繁模式挖掘,关联规则和顺序模式挖掘相关的 Java 代码感兴趣,我有一个小型开源项目,有42个算法与这些主题相关:http://www.philippe-fournier-viger.com/spmf/

    但请注意,它不提供任何用户界面。但是它提供了一些你在其他数据挖掘包中找不到的非常专业的算法。

    答案 5 :(得分:1)

    我在高中课程中使用过 Weka ,并且有一个很好的SVM实现。这是4或5年前。

    答案 6 :(得分:1)

    KNIME )是一个相当广泛的数据挖掘平台。

    答案 7 :(得分:1)

    根据2011年KDnuggets民意调查,RapidMiner再次成为全球使用最广泛的数据挖掘解决方案: http://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html

    答案 8 :(得分:1)

    看一下ELKI,就像WEKA一样,除了它在聚类和异常值检测方面要强得多,而WEKA基本上只能很好地进行分类。

    答案 9 :(得分:0)

    如前所述,Pentaho是WEKA所属的强大商业智能套件。

    所以我也推荐Weka,只是为了你有一个很好的解决方案来扩展你的应用程序和一个伟大的社区。