比较两个N维数组

时间:2014-03-12 19:40:43

标签: python arrays numpy scipy scikit-learn

我有两组N维数组,我需要以某种方式比较并获得一个代表它们“相似”程度的值。在统计学上,这是一个双样本拟合优度问题,其假设是两个数组来自相同的父分布。

为了简化,想象一下如下所示的二维数组:

enter image description here

我需要提供一个数字来量化它们的“相似”程度。

是否有python个包提供这样的统计测试?我愿意使用numpyscipyscikit-learn等。


添加

我发现了一个scipy包,显然可以满足我的需求,但它只适用于一维数组:scipy.stats.ks_2sampR统计软件的ks package包含kde.test功能。这个功能可以满足我的需要,但我想要python实现。

1 个答案:

答案 0 :(得分:1)

既然你知道一个可以解决问题的R包,你的应用程序是否可以从Python调用R? rpy2包允许您与R(https://pypi.python.org/pypi/rpy2/)进行通信,如果您正在使用IPython,则可以使用rmagichttp://ipython.org/ipython-doc/dev/config/extensions/rmagic.html)以交互方式执行此操作。 rpy2中还有一些实验pandas支持。 http://pandas.pydata.org/pandas-docs/dev/r_interface.html