我最近开始与R合作,我试图看到两个定量变量F和测试之间的关系 我的脚本是
library(dplyr)
library(ggplot2)
x = read.table("Input.txt", header = T)
ggplot(data = x, aes(x = F, y = Test)) +
geom_point(colour = "red")
cor(x$F, x$Test)
ggplot(data = x, aes(x = sqrt(F), y = sqrt(Test))) +
geom_point(colour = "red")+
geom_smooth(method = "lm")
lmodel = lm(sqrt(Test) ~ sqrt(F), data = x)
结果附后
summary(lmodel)
Call:
lm(formula = sqrt(Test) ~ sqrt(F), data = x)
Residuals:
Min 1Q Median 3Q Max
-3140.9 -2575.8 -1779.5 -146.2 18137.6
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2818 3910 0.721 0.479
sqrt(F) 2169 7668 0.283 0.780
Residual standard error: 5233 on 21 degrees of freedom
Multiple R-squared: 0.003796, Adjusted R-squared: -0.04364
F-statistic: 0.08001 on 1 and 21 DF, p-value: 0.78
我只是不了解关于摘要输出的R手册。
如果我只看线性模型的p值,那么它的差和相关性告诉它没有线性关系
任何人都可以帮助我理解这一点。
任何人都可以告诉我的剧本是正确的。
答案 0 :(得分:1)
您可以在以下链接中找到有关summary
解释的更多信息。
https://feliperego.github.io/blog/2015/10/23/Interpreting-Model-Output-In-R
您的p值始终介于0和1之间,按以下方式解释。
小p-value
表示有强有力的证据反对您的零假设。
一个大的p-value
表示反对零假设的证据很弱。
你的p-value
非常接近1.但不,这并不意味着你的模型很糟糕。
大学统计学教授Stephen Tigler表示,异常高p值表明数据与模型相匹配可疑......这是一个高p-value
表明实际上没有相关性或您的数据之间的关联。这有点像随机性的指标。表明你有多少机会观察到你已经拥有的相关性。
另外,正如您猜测的那样,两个变量之间似乎没有任何关系。您的R平方统计量可以衡量模型的拟合程度。越接近1越好......