我有.csv文件,我用命令阅读:
my_data <- read.csv("file_name")
它有很多列,但我希望得到行数,具有特定的列条件,例如行数,其中列的值为#34; VAL&#34;是更大的20. 我试过了:
k <-subset(my_data, my_data$VAL > 24)
length(k)
但它看起来不正确。我不知道如何让它发挥作用。
答案 0 :(得分:0)
如果你只对这些观察的数量感兴趣,那么我更喜欢简单地总结一个布尔矢量。 R的最大优势可能是矢量化操作,(df$y > 100)
将为您提供一个向量,指示每个单独的观察是真还是假。然后,您可以对此求和以获得真实的总数。
x <- 1:10000
y <- rnorm(1000,100,10)
df <- as.data.frame(cbind(x,y)) #create a dataframe
count <- sum(df$y > 100)
答案 1 :(得分:0)
dim(k)
如果您需要保留数据框或dim(subset(my_data, my_data$VAL > 24))