简介
我正在一个关于其繁殖地的殖民边境进行鸟类攻击的小型试点研究。
背景
这项研究进行了多年,展示了殖民(南部)和定居(北部)领的捕蝇雄性雄性具有同种和斑姬的捕蝇雄性。根据可量化的集合积极行动评分他们的行为。 他们在60年前发现了这个岛屿,并且正在他们繁殖地的一个点上稳步扩散,并将他们的相对斑点捕蝇器从更多的带虫区域推开。 在之前的研究中,研究表明,更具侵略性的雄性在这种定植行动的前沿。在北部地区,有近100%的领子,南部仍有混合人口。
Hypothesises
在南部地区,雄性项圈捕蝇器将对这两个物种采取更高的攻击行动。 与在南方相比,雄性对北方的反应相对更多。
问题
在对所有互动进行评分之后,我现在不知道用什么测试来呈现数据。很多人给出不同的建议或简单的Anova等 我一直在学习R和统计学,但许多术语仍然让我困惑,在互联网上找到的问题和答案我发现很难解释我的数据。 (这是我打扰你的地方)。
问题
以下三项中的哪项测试可以最好地用于表明存在或没有统计学意义?
数据结构
遗憾的是,数据不平衡。
同种试验的数量为104个,其中77个在北部试验区,27个在南部。 同样,50只捕蝇器的假试验36只在北方,14只在南方。
'data.frame': 154 obs. of 8 variables:
$ location : Factor w/ 2 levels "N","S": 1 1 1 1 1 1 1 1 2 1 ...
$ score : int 1 4 0 1 1 8 9 9 4 3 ...
$ dummy_species : Factor w/ 2 levels "CF","PF": 1 1 2 2 1 1 1 1 1 2 ...
model.tables(aov(scoreCF$score~scoreCF$location),"means")
Tables of means
Grand mean
2.993506
dummy_species
CF PF
3.529 1.88
rep 104.000 50.00
location
N S
2.742 3.686
rep 113.000 41.000
dummy_species:location
location
dummy_species N S
CF 3.19 4.48
rep 77.00 27.00
PF 1.81 2.07
rep 36.00 14.00
TukeyHSD(AOV(评分〜dummy_species *位置))
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = score ~ dummy_species * location)
$dummy_species
diff lwr upr p adj
PF-CF -1.648846 -2.613568 -0.6841239 0.0009332
$location
diff lwr upr p adj
S-N 0.9440487 -0.07800284 1.9661 0.0699746
$`dummy_species:location`
diff lwr upr p adj
PF:N-CF:N -1.389250 -2.8774793 0.09898005 0.0766924
CF:S-CF:N 1.286676 -0.3619293 2.93528192 0.1824646
PF:S-CF:N -1.123377 -3.2649782 1.01822492 0.5246337
CF:S-PF:N 2.675926 0.7993571 4.55249475 0.0016744
PF:S-PF:N 0.265873 -2.0557788 2.58752484 0.9908082
PF:S-CF:S -2.410053 -4.8376320 0.01752615 0.0524523
结果
*Anova(lm(score~dummy_species*location))
Anova Table (Type II tests)*
Response: score
Sum Sq Df F value Pr(>F)
dummy_species 93.91 1 11.6673 0.0008186 ***
location 26.82 1 3.3326 0.0699100 .
dummy_species:location 6.98 1 0.8675 0.3531437
Residuals 1207.39 150
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
*> summary(aov(score~dummy_species*location))*
Df Sum Sq Mean Sq F value Pr(>F)
dummy_species 1 91.8 91.80 11.405 0.000933 ***
location 1 26.8 26.82 3.333 0.069910 .
dummy_species:location 1 7.0 6.98 0.868 0.353144
Residuals 150 1207.4 8.05
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
*> summary(lm(score~dummy_species*location))*
Call:
lm(formula = score ~ dummy_species * location)
Residuals:
Min 1Q Median 3Q Max
-4.4815 -2.1948 -0.8056 2.1280 6.9286
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.1948 0.3233 9.881 <2e-16 ***
dummy_speciesPF -1.3892 0.5728 -2.425 0.0165 *
locationS 1.2867 0.6346 2.028 0.0444 *
dummy_speciesPF:locationS -1.0208 1.0960 -0.931 0.3531
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.837 on 150 degrees of freedom
Multiple R-squared: 0.09423, Adjusted R-squared: 0.07611
F-statistic: 5.202 on 3 and 150 DF, p-value: 0.001909
谢谢 花时间,看看。 理想情况下,给予时间投资(在现场和幕后)我很想知道男性的攻击很可能受到位置和物种的影响。 但只有lm方法是相关的。
我也对我的问题布局表示歉意。