我的数据集如下:
sex age age_group district obj 1 obj 2 obj 3
1 39 30-44 5 0 1 0
0 40 30-44 24 0 0 1
1 50 45-64 12 1 0 0
1 39 30-44 11 0 0 0
1 30 30-44 14 0 1 0
1 33 30-44 26 0 0 0
要求受访者在18个政策目标中选择3个(为了简洁起见,我仅提出3个目标)。我想检查他们的选择是否取决于年龄和地区。我知道混合的logit模型是合适的,但诀窍是,我有18个因变量,可能有群效应起作用(一起选择两个或多个目标,因为它们对受访者而言看起来很相似)。我问了stat(https://stats.stackexchange.com/questions/389005/multiple-answer-survey-building-a-regression-model),我想我应该将目标重新编码为三个独立的变量,就好像它们是独立的一样,这是来自三个不同的问题回合。我想理想的数据输入应如下所示,其中 choice_no 是一个任意分配的选择编号,所有三行均引用一个受访者:
sex age age_group district choice choice_no
1 39 30-44 5 obj4 1
1 39 30-44 5 obj7 2
1 39 30-44 5 obj16 3
choice_no列不包含任何排名的首选项,它将被随机分配(调查表上的最高选择进入第一行,依此类推)。我的想法正确吗?如果是这样,如何在R中实现呢?
彼得,谢谢你