计算数组的统计信息

时间:2012-11-26 07:06:40

标签: ruby statistics

我正在构建一个需要计算数据集统计信息的Web应用程序。我需要计算数组上的百分位数,平均值,模式和其他统计函数。

通常在Python中,我会使用scipy,numpy或nltk,它具有庞大的stat数组函数库。我可以利用任何红宝石或图书馆来做这件事吗?

如果没有任何现有的库,是否有一种简单的方法可以在Python中进行数据处理,同时将我的应用程序保存在Ruby / Rails中?

6 个答案:

答案 0 :(得分:7)

如果您确实需要完整的统计资料库,请查看statsample。否则,您可能会发现descriptive_statistics是一个不错的轻量级选择。

答案 1 :(得分:1)

您可以使用RubystatsEasystats。我相信那里有更多我不知道的宝石。

答案 2 :(得分:0)

对于数字训练Narray是标准建议。它的统计方法是求和,累积求和,乘积(乘法元素),累积产量,均值,标准差,均方根,均方根偏差,最小值,最大值和中位数。

专注于数字,claimed速度提高50倍,内存效率更高。

答案 3 :(得分:0)

如果您正在计算ActiveRecord模型的统计数据,那么您可能想要查看statistics gem。

我还为statisticus添加了书签,它提供了GNU-R集成,SIRB可以在控制台中使用。

有许多方法可以在Rails应用程序下运行Python,但是在Ruby库中找到所需的方法可能更容易。

答案 4 :(得分:0)

我已经实现了一个新的Gem - MDArray,可以在JRuby中进行统计。对于Web应用程序来说,这实际上可能非常好,因为JRuby基本上是Java。 MDArray遵循NArray和Numpy哲学,并且在这一点上它可能比两者都慢,它应该比纯Ruby替代品更快。

检查出来,如果您需要任何帮助,我很乐意尝试帮助。

干杯,

罗德里戈

答案 5 :(得分:0)

您可以使用NMatrix,这是一个类似于NumPy的数值库,用于不断的开发。 (免责声明:我来自SciRuby / NMatrix团队)