我目前正在设计一个调查系统(调查有很多问题,一个问题有很多答案,一个回复属于一个用户,调查,问题和答案)。
我将在用户模型中包含大量人口统计数据,并期望对各种问题进行数百次回复等。
例如,最终我们会想要分析回复。 80%的男性喜欢香蕉,20%的女性拥有福特等等。
我正在研究像R,SAS和SPSS这样的统计语言,我想知道我的数据是否需要以任何特定方式构建才能被这些程序使用?或者他们都接受csv文件?
您对统计数据有何建议,并为其构建数据模型?
最后,SAS,SPSS和Stata的费用是多少?
答案 0 :(得分:2)
CSV files
绰绰有余。 R
功能强大,可管理按行和列排列的所有数据。
例如:您可以将csv的所有列排列为带有标题的变量/响应,您的行可以是数据,反之亦然。
只要它们按行和列排列就没有关系。可以轻松处理CSV文件中的Comma
,Space
个非限制列。并非我具体,您可以使delimiter
和R
具有强大的regular expression
匹配。
唯一的建议是,您应该为不同的数据集制作不同的CSV文件,以简化操作,并且可以轻松地从CSV文件导入data-frame
。
完成后,您可以释放R