如何在java应用程序中使用renjin来创建多个相关性

时间:2014-06-23 22:06:56

标签: java r math regression renjin

我想使用java来使用大型数据集执行多重关联。我无法找到任何提供此功能的库。我能找到的最接近的位于[https://commons.apache.org/proper/commons-math/apidocs/org/apache/commons/math3/stat/correlation/SpearmansCorrelation.html][1],但这只是部分相关而不是多重。我想我可以使用R来做这个,但我的数据集非常大(数万亿),我想从使用Java的性能(线程,多核等)中受益。是否有一个库可以进行多重关联,任何人都知道?如果图书馆可以执行逐步多元回归,也会很棒。

1 个答案:

答案 0 :(得分:0)

你最好的选择可能是Apache Mahout--它在Hadoop之上提供了一组可扩展的算法。

https://mahout.apache.org/