我试图计算以下方案的参与者平均分数: 1.从多个变量(测试项目)中获取一系列值, 2.仅针对回答是或否的项目计算平均分数, 3.省略NA值影响平均值但计算频率并获取所有NA值的坐标, 4.将新发现的平均值存储在新变量中。
我需要使用二进制问题(1 =是,0 =否,-99 =缺失/ NA),如下所示:
id var1 var2 var3 var4 var5
1 1 0 0 0 0
2 1 1 0 1 1
3 1 0 0 1 0
4 1 0 0 1 0
5 1 0 0 0 0
6 1 1 0 0 1
7 1 1 0 0 1
8 1 1 0 0 0
9 1 0 1 0 1
10 1 0 0 -99 1
11 1 1 0 1 0
12 1 0 0 1 0
13 1 0 0 -99 0
14 1 -99 0 1 1
15 1 0 0 1 0
16 1 0 0 0 1
17 1 0 0 1 0
18 1 0 -99 0 1
19 1 0 0 1 0
20 1 0 0 1 1
21 1 0 0 1 0
22 1 0 0 1 1
23 1 0 0 1 0
24 1 0 0 0 1
25 1 0 0 0 0
26 1 0 0 1 0
27 1 0 0 0 0
28 1 1 0 1 1
使用李克特量表问题(0 =非常不同意/ 6 =非常不同意,-99缺失/不适用)。
var10 var11 var12 var13 var14
1 1 1 1 0
4 1 1 1 1
1 1 1 1 1
2 1 1 1 1
4 1 1 1 1
2 1 1 1 0
1 1 1 1 0
1 1 1 1 1
2 1 1 1 1
1 1 1 1 0
4 1 1 1 1
4 1 1 1 1
-99 1 1 1 1
1 1 2 1 1
1 4 2 2 0
4 1 1 1 1
4 1 1 1 1
1 1 1 1 1
2 1 1 1 1
4 1 1 1 0
1 1 1 1 1
4 1 1 1 1
1 1 1 1 1
4 1 1 1 1
1 1 1 1 1
有关如何解决此问题的任何想法?我确定可以通过选择单个列或指定从中绘制数据的列范围来完成。但是,我在R中编写如此复杂的多步骤函数方面缺乏经验,所以我希望得到一个老练的建议。
提前致谢。