在导入excel数据并准备数据框时,在我告诉R忽略满足特定条件的列的步骤之后,会以某种方式添加不需要的行。
我应该有36行,但是最后我得到了36行数据,然后是所有行中有210行NA数据。它们不应该在那里,因为我的初始数据在那些行中没有任何信息,并且在R的中间步骤中,数据帧确实只有36行。
以下是代码:
setwd("C:/Users/John/Desktop/School/Afstudeer/Data/Results")
x<-c("permute", "vegan", "xlsx")
lapply(x, require, character.only = TRUE)
sampSet <- read.xlsx2('Taxa_Counts_R_TRANSPOSED.xlsx', 1, endRow=37,
as.data.frame=TRUE, header=TRUE, colClasses= NA)
sampSetO<-sampSet[complete.cases(sampSet),]
row.names(sampSetO) <- sampSetO$Location
sampSetO[1] <- NULL
sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]
View(sampSet)
View(sampSetO)
View(sampSetOK)
因此,sampSetO看起来不错。 sampSetOK一团糟。很自然地认为这一行出了问题:
"sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]"
这是sampSetO:
这是我获得sampSetOK的结果(请注意条目数):
我做了类似的一行,在这里我有rowSums而不是colSums,这很好。...
那么可能是什么问题,我该如何避免呢?