我从数据集中抽取了30个随机样本。我需要计算每个样本的样本均值和样本方差,并将它们排列在一个表格中,其中有3列标题为"样本","平均"和"方差"
我的数据集是:
lab6data <- c(2,5,4,6,7,8,4,5,9,7,3,4,7,12,4,10,9,7,8,11,8,
6,13,9,6,7,4,5,2,3,10,13,4,12,9,6,7,3,4,2)
我制作的样本如下:
observations <- matrix(lab6data, 30, 5)
并且每个样本分别用于:
means <- rowMeans(observations)
你能帮我找一下每个样品的差异吗?
答案 0 :(得分:1)
您可以使用@SET BDS=C:\Program Files (x86)\Embarcadero\RAD Studio\12.0
@SET BDSINCLUDE=C:\Program Files (x86)\Embarcadero\RAD Studio\12.0\include
@SET BDSCOMMONDIR=C:\Users\Public\Documents\RAD Studio\12.0
@SET FrameworkDir=C:\Windows\Microsoft.NET\Framework\v3.5
@SET FrameworkVersion=v3.5
@SET FrameworkSDKDir=
@SET PATH=%FrameworkDir%;%FrameworkSDKDir%;C:\Program Files (x86)\Embarcadero\RAD Studio\12.0\bin;C:\Program Files (x86)\Embarcadero\RAD Studio\12.0\bin64;%PATH%
@SET LANGDIR=DE
计算每行的差异:
apply
或者使用apply(observations, 1, var)
包中的rowVars
。
请注意,matrixStats
会比matrixStats::rowVars
更轻微 (参见下面的@ HenrikB评论),与apply(..., 1, var)
相同。 1}}比rowMeans
快。
答案 1 :(得分:0)
我们可以使用pmap
在data.frame
library(purrr)
varS <- pmap_dbl(as.data.frame(observations), ~ var(c(...)))
cbind(observations, varS)
observations <- matrix(lab6data, 10, 4)