我正在研究一种出版物,该出版物研究少数族裔在某些文章中的作者人数上升的情况。有明显的增长趋势,但我想应用一些严格的统计数据。我的数据框架很简单:年份和少数族裔作者身份。但是,在我的上下文中,Cochran-Armitage输入数据框没有任何意义。我使用的测试正确吗?
我已经完善了数据框,并通过在x轴上生成年数以及在y轴上生成少数作者的百分比来准备它。基本上是1行和10列(每列代表一年)。但是,cochran-armitage不能接受1行数据帧
我的数据框就这样存在
year 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
race 11.1 12.1 14.2 15.2 19.2 20.5 21.8 27.9 30.1 31.1
答案 0 :(得分:1)
Cochrane Armitage可能是错误的测试,它用于具有2个类别的变量与具有K个类别的序数变量之间的关联。您有两个变量,每个变量只有一个类别。
我认为简单的线性回归是可行的。实际上,当您对所提供的数据运行一个(您丢失了2018年的%,因此我删除了该行)时,您将得到:
> summary(y_p)
Call:
lm(formula = year ~ percent, data = y_p)
Residuals:
Min 1Q Median 3Q Max
-0.77079 -0.38560 -0.03582 0.35535 0.90139
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.004e+03 5.428e-01 3692.52 < 2e-16 ***
percent 4.045e-01 2.526e-02 16.01 2.32e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5586 on 8 degrees of freedom
Multiple R-squared: 0.9697, Adjusted R-squared: 0.966
F-statistic: 256.4 on 1 and 8 DF, p-value: 2.319e-07
这对我来说意义重大,但您需要检查残差等以确保确定。