Question

在导入excel数据并准备数据框时，在我告诉R忽略满足特定条件的列的步骤之后，会以某种方式添加不需要的行。

我应该有36行，但是最后我得到了36行数据，然后是所有行中有210行NA数据。它们不应该在那里，因为我的初始数据在那些行中没有任何信息，并且在R的中间步骤中，数据帧确实只有36行。

以下是代码：

setwd("C:/Users/John/Desktop/School/Afstudeer/Data/Results")

x<-c("permute", "vegan", "xlsx")

lapply(x, require, character.only = TRUE)

sampSet <- read.xlsx2('Taxa_Counts_R_TRANSPOSED.xlsx', 1, endRow=37, 
as.data.frame=TRUE, header=TRUE, colClasses= NA)

sampSetO<-sampSet[complete.cases(sampSet),]

row.names(sampSetO) <- sampSetO$Location
sampSetO[1] <- NULL

sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]

View(sampSet)

View(sampSetO)

View(sampSetOK)

因此，sampSetO看起来不错。 sampSetOK一团糟。很自然地认为这一行出了问题：

"sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]"

这是sampSetO：

sampSetO_Good

这是我获得sampSetOK的结果（请注意条目数）：

Unwanted_Rows

我做了类似的一行，在这里我有rowSums而不是colSums，这很好。...

那么可能是什么问题，我该如何避免呢？

不需要的行添加到数据框

0 个答案: