打包相关性数据的最佳格式?

时间:2014-02-12 21:50:31

标签: python csv scipy correlation

我正在使用Java程序提取一些数据点,并计划使用scipy来确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个相应的数据集,以便我可以轻松地将其读入scipy

1 个答案:

答案 0 :(得分:1)

每个数据集都是一列,所有数据集组合在一起形成CSV。它被array读取为2D numpy.genfromtxt(),然后调用numpy.corrcoef()以获取相关系数。

注意:您还应该考虑相同的数据布局,但使用pandas。通过dataframe将CSV读入pandas.read_csv()并按.corr()

获取相关系数