我在分离的.h5文件(分层数据格式5,HDF5)中有两组数据,使用python脚本获得,我想进行统计分析以找到它们之间的相关性。我在这里的经历有限;我不知道任何R。
我想将数据加载到SPSS中,但SPSS似乎不支持.h5。什么是最好的方式去这里?我可以将所有内容写入.csv文件,但我会丢失变量的名称。有没有办法转换数据而不丢失任何信息?为什么SPSS不支持h5?
我知道Rpy模块的存在。你认为在R中学习编程是否值得?这会给我提供与SPSS相同的方法库吗?
感谢您的投入!
答案 0 :(得分:1)
有没有办法在不丢失任何信息的情况下转换数据?
如果HDF5数据足够常规,您只需将其加载到Python或R中,然后再将其保存为CSV(如果您更喜欢冒险和/或关注性能,甚至可以将其保存为SPSS .sav格式)。
为什么SPSS不支持h5呢?
谁知道呢。它可能应该。哦,好吧。
你认为在R中学习编程是否值得?
如果您发现SPSS有用,您可能还会发现R很有用。既然你提到过Python,你可能会觉得它很有用,但它更像是一种通用语言:更灵活,但不太关注数学和统计数据。
R会给我与SPSS中相同的方法库吗?
可能,具体取决于您正在做什么。 R拥有数学和统计学的大部分内容,包括可安装包中的一些相当深奥和/或新的算法。它有一些Python没有(但),但Python也涵盖了许多用户的大多数基础。