R在正确读取数据以进行线性模型分析时遇到问题,我无法确定CSV文件或脚本是否有问题。这是我的数据结构:
str(ASM_Data)
'data.frame': 284 obs. of 20 variables:
$ TRIAL_ID : Factor w/ 2 levels "","18ASM_OvOv": 2 2 2 2 2 2 2 2 2
2 ...
$ PLOT_ID : Factor w/ 271 levels "","18ASM_OvOv_002",..: 2 3 4 5 6 7 8 9 10 11 ...
$ PLOT : int 2 3 4 5 6 7 8 9 10 12 ...
$ ROW : int 1 1 1 1 1 1 1 1 1 1 ...
$ RANGE : int 2 3 4 5 6 7 8 9 10 12 ...
$ REP : int 1 1 1 1 1 1 1 1 1 1 ...
$ MP : int 1 1 1 1 1 1 1 1 1 1 ...
$ SUB.PLOT : Factor w/ 7 levels "","A","B","C",..: 2 2 2 2 3 3 3 3 3 4 ...
$ ENTRY_NO : int 965 931 936 983 926 969 883 911 897 985 ...
$ height : Factor w/ 27 levels "","55","56","58",..: 20 16 19 26 16 19 21 14 11 14 ...
“高度”的正确数据是:
ASM_Data$height
[1] 74 70 73 80 70 73 75 68 65 68 72 68 73 73 73 66 72 74 71 74 70 67 63 71 69 69 78 67 70 62 71 70 70 72 72 65 63 64
[39] 62 76 75 67 74 62 59 65 80 70 68 66 65 70 77 60 69 70 76 60 59 73 65 75 62 61 65 64 75 78 69 72 69 73 77 70 71 70
[77] 70 70 71 67 70 75 71 70 73 66 68 62 69 73 63 75 64 68 68 66 70 66 70 69 73 69 70 72 67 75 66 67 56 64 70 66 67 60
[115] 66 59 73 68 65 77 70 67 65 66 75 73 78 70 66 71 61 60 62 64 73 70 62 73 68 67 70 66 72 69 70 63 65 64 70 64 71 67
[153] 74 69 63 61 65 71 59 70 77 77 68 68 70 65 66 70 72 66 70 72 70 70 75 77 74 75 64 69 70 79 65 67 71
但是当我将高度设置为数值因子时(因为我将线性模型作为响应变量进行了测试),数字将发生如下变化:
ASM_Data$height <- as.numeric(ASM_Data$height)
head(ASM_Data$height)
[1] 20 16 19 26 16 19
这真的很奇怪,因为身高的最小值的数据是55 ....所以我不知道这些数字的来源。
有人可以帮忙吗?