.h5文件的统计分析(SPSS?)

时间:2014-03-16 11:55:32

标签: python r hdf5 statistics h5py

我在分离的.h5文件(分层数据格式5,HDF5)中有两组数据,使用python脚本获得,我想进行统计分析以找到它们之间的相关性。我在这里的经历有限;我不知道任何R。

我想将数据加载到SPSS中,但SPSS似乎不支持.h5。什么是最好的方式去这里?我可以将所有内容写入.csv文件,但我会丢失变量的名称。有没有办法转换数据而不丢失任何信息?为什么SPSS不支持h5?

我知道Rpy模块的存在。你认为在R中学习编程是否值得?这会给我提供与SPSS相同的方法库吗?

感谢您的投入!

1 个答案:

答案 0 :(得分:1)

  

有没有办法在不丢失任何信息的情况下转换数据?

如果HDF5数据足够常规,您只需将其加载到Python或R中,然后再将其保存为CSV(如果您更喜欢冒险和/或关注性能,甚至可以将其保存为SPSS .sav格式)。

  

为什么SPSS不支持h5呢?

谁知道呢。它可能应该。哦,好吧。

  

你认为在R中学习编程是否值得?

如果您发现SPSS有用,您可能还会发现R很有用。既然你提到过Python,你可能会觉得它很有用,但它更像是一种通用语言:更灵活,但不太关注数学和统计数据。

  

R会给我与SPSS中相同的方法库吗?

可能,具体取决于您正在做什么。 R拥有数学和统计学的大部分内容,包括可安装包中的一些相当深奥和/或新的算法。它有一些Python没有(但),但Python也涵盖了许多用户的大多数基础。