请考虑以下示例数据集:
a <- c(1, 2, 3, 1, 4, 1968, 2, 1)
b <- c(2, 1, 2, 4, 3, 1984, 2, 0)
c <- c(3, 3, 4, 2, 1, 1945, 1, 0)
d <- c(4, 1, 4, 3, 2, 1975, 3, 1)
df <- data.frame(rbind(a,b,c,d))
names(df) <- c("ID", "OptionW", "OptionX", "OptionY", "OptionZ", "yearofBirth", "education", "sex")
ID OptionW OptionX OptionY OptionZ yearofBirth education sex
1 2 3 1 4 1968 2 1
2 1 2 4 3 1984 2 0
3 3 4 2 1 1945 1 0
4 1 4 3 2 1975 3 1
有200人被要求将选项W到Z从1到4排名,以降低他们社区的犯罪率。他们的年龄,最高学历和性别也都有注释。 我想知道:
我读到多项逻辑回归可能是要走的路,但我发现很难将我找到的例子调整到我的数据集中。通常它们只允许选择一个选项,使每个选项(W,X Y Z)成为一个变量的水平(选项)。但在我的情况下,我有几个变量(OptionW,OptionX,OptionY,OptionZ),其中排名位置似乎是级别(1,2,3,... 10)。或者我是以错误的方式看待它?
哪种套餐适合哪种功能?除了多项Logistic回归之外还有其他方法吗?我可以对200个样品进行聚类分析吗?
我主要使用R进行空间分析,而且统计数据不是很流畅。希望你能在这里帮助我。