r的显着差异

时间:2013-01-11 23:39:35

标签: r statistics significance

所以这是我的问题:

我有大量关于声音制作的数据以及重点在哪里。我要做的是确定压力和无应力音节的制作之间的差异是否显着。问题是当我尝试使用cor()函数时,数据集的长度不同。我有大约500个压力音节的实例,但只有400个无重音音节。我对r很新,但这是我尝试过的代码:

data <- read.csv('D:/blaaah/Stressed.csv', header=TRUE)
var1 <- data$intdiff
data <- read.csv('D:/blaaah/Unstressed.csv', header=TRUE)
var2 <- data$intdiff
cor(var1, var2)

当然,我收到一个错误,因为数据集的长度不同。那么如何检查集合之间的重要性而不使它们具有相同的长度?

非常感谢!

P.S。请问我的问题是否不明确。我担心我有时会认为每个人都知道我在做什么......

1 个答案:

答案 0 :(得分:4)

如果您希望 var1 var2 之间存在关系,则使用cor()是合适的,例如,如果您希望项目的值在如果 var1 中的相应项目较大, var2 会更大。当数据集的长度不同时存在困难,因为一旦超过较短数据集的末尾就没有相应的项目可供比较。

我认为,在这种情况下,对两个数据集进行比较以确定它们的均值是否不同更有可能对您有用。为此,您需要使用t测试,如上所述,使用R here中的示例。您还需要确认使用t检验的假设对于这种情况是有效的,例如见here