我想知道Apache Commons Math中的所有操作是否都在内存操作中。 我对OLSMultipleLinearRegression特别感兴趣并将其用于大数据。
还有用于在大数据上运行回归的现有JAVA API。
答案 0 :(得分:2)
我对OLSMultipleLinearRegression
类的javadocs的阅读是它完全在记忆中。首先,模型和样本数据必须作为原始数组提供,这排除了任何不适合存储器的表示的可能性......至少在您提供输入的位置。
答案 1 :(得分:0)
OLSMultipleLinearRegression
将完整的设计矩阵存储在内存中是正确的。然而,在同一个Commons Math包(版本3.0以后)中有另一个OLS实现类MillerUpdatingRegression
,它不会将输入数据集存储在内存中。