R中的排名选择:结果分析

时间:2015-09-28 13:35:37

标签: r statistics regression multinomial

请考虑以下示例数据集:

a <- c(1, 2, 3, 1, 4, 1968, 2, 1)
b <- c(2, 1, 2, 4, 3, 1984, 2, 0)
c <- c(3, 3, 4, 2, 1, 1945, 1, 0)
d <- c(4, 1, 4, 3, 2, 1975, 3, 1)
df <- data.frame(rbind(a,b,c,d))
names(df) <- c("ID", "OptionW", "OptionX", "OptionY", "OptionZ", "yearofBirth", "education", "sex")


ID OptionW OptionX OptionY OptionZ yearofBirth education sex
1       2       3       1       4        1968         2   1
2       1       2       4       3        1984         2   0
3       3       4       2       1        1945         1   0
4       1       4       3       2        1975         3   1

有200人被要求将选项W到Z从1到4排名,以降低他们社区的犯罪率。他们的年龄,最高学历和性别也都有注释。 我想知道:

  • 哪些选项是大多数公民的首选?
  • 在男性或女性,老年人或年轻人,受过良好教育或受过良好教育的公民中,是否存在显着差异?
  • 如果这个人年龄较大/年轻,接受过正规教育并且是男性还是女性,排名顺序有多大可能会发生变化?

我读到多项逻辑回归可能是要走的路,但我发现很难将我找到的例子调整到我的数据集中。通常它们只允许选择一个选项,使每个选项(W,X Y Z)成为一个变量的水平(选项)。但在我的情况下,我有几个变量(OptionW,OptionX,OptionY,OptionZ),其中排名位置似乎是级别(1,2,3,... 10)。或者我是以错误的方式看待它?

哪种套餐适合哪种功能?除了多项Logistic回归之外还有其他方法吗?我可以对200个样品进行聚类分析吗?

我主要使用R进行空间分析,而且统计数据不是很流畅。希望你能在这里帮助我。

0 个答案:

没有答案