我正在使用Java程序提取一些数据点,并计划使用scipy
来确定相关系数。我计划将数据提取到csv样式的文件中。我应该如何格式化每个相应的数据集,以便我可以轻松地将其读入scipy
?
答案 0 :(得分:1)
每个数据集都是一列,所有数据集组合在一起形成CSV。它被array
读取为2D numpy.genfromtxt()
,然后调用numpy.corrcoef()
以获取相关系数。
注意:您还应该考虑相同的数据布局,但使用pandas
。通过dataframe
将CSV读入pandas.read_csv()
并按.corr()