关于在Java中计算Pearson的相关性,需要一些指向正确的方向

时间:2010-12-12 02:30:38

标签: java matrix statistics correlation pearson

我试图在制表符分隔的文本文件中计算13个变量之间的Pearsons相关性,其中每列是变量。我正在使用java,并希望有人可以给我一些关于我应该使用哪些库或哪些函数的指导。我猜我首先需要阅读该文件的内容,但无法弄清楚如何基本上让程序知道每列都像一个数组,这将使我能够进行我所需的计算。我原本以为java.io包对我来说是最好的开始,但是无法弄清楚我可以用什么类来解决我的问题。我还查看了http://commons.apache.org/math/,它具有测量皮尔森相关性的功能,但这太简单了,因为这是一个Uni赋值,我必须从头开始实现它。通过查看appache pearsons相关性,他们似乎已经接近了问题,就像矩阵中矩阵的每一列都是一个变量。

很抱歉我的问题很冗长。如果你们知道任何网站或任何好的kewords搜索或任何其他信息,我将不胜感激。谢谢,Arlind。

1 个答案:

答案 0 :(得分:1)

您应该只使用标准的java Math,String,File I / O库以及一些数组和循环来实现这一点!

首先阅读本文,了解如何阅读文件。 http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

在循环内部使用String.split(String regex)方法解析csv文件。例如strLine.split( “”)。

通过对String []

中的每个String使用Double.parseDouble,将其转换为双精度数组

从那里你可以使用 Math.sqrt(双a)和 Math.pow(double a,double b)与一些简单循环一起用于计算每对变量的相关性。

希望有足够的信息让您入门,如果您需要更多帮助,请随时回复!