我在 R 中稍微涉足我,我现在能够通过他们的方式对列进行排序,但我现在想按每列中最大范围的数据点对列进行排序
说我有一张电影评分的桌子。如何才能获得意见最为不同的十大电影。有没有可以测量的功能?我的一个想法是使用minValue和maxValue,但是只有一个异常值可能会把它弄得一团糟。
我想盒子图的盒子大小可能是一个很好的衡量标准。
有什么想法吗?
更新:
所以我尝试按他们各自的sd()
对我的表进行排序,但我不能让它工作。我在想的是这个。该表有标题顺便说一句。并在此处命名为newdata
。
> newdata.sd <- sapply(1:107, function(j) sd(newdata[,j], na.rm=TRUE))
> newdata.sorted.sd <- newdata[,names(sort(newdata.sd, decreasing=TRUE))]
第二行会抛出错误,因为第一行不会生成Named num
向量
当我按照列进行排序时做同样的事情意味着它有效。我用以下两行做了。
> newdata.mean <- colMeans(newdata, na.rm=TRUE)
> newdata.sorted <- newdata[,names(sort(newdata.mean, decreasing=TRUE))]
如何在第二个例子中生成sd()
s的命名向量?
另外一种按sd()
排序的方式也会受到赞赏。