我有两组N维数组,我需要以某种方式比较并获得一个代表它们“相似”程度的值。在统计学上,这是一个双样本拟合优度问题,其假设是两个数组来自相同的父分布。
为了简化,想象一下如下所示的二维数组:
我需要提供一个数字来量化它们的“相似”程度。
是否有python
个包提供这样的统计测试?我愿意使用numpy
,scipy
,scikit-learn
等。
添加
我发现了一个scipy
包,显然可以满足我的需求,但它只适用于一维数组:scipy.stats.ks_2samp。 R
统计软件的ks package包含kde.test
功能。这个功能可以满足我的需要,但我想要python
实现。
答案 0 :(得分:1)
既然你知道一个可以解决问题的R包,你的应用程序是否可以从Python调用R? rpy2
包允许您与R(https://pypi.python.org/pypi/rpy2/)进行通信,如果您正在使用IPython,则可以使用rmagic
(http://ipython.org/ipython-doc/dev/config/extensions/rmagic.html)以交互方式执行此操作。 rpy2
中还有一些实验pandas
支持。 http://pandas.pydata.org/pandas-docs/dev/r_interface.html