Question

我有.csv文件，我用命令阅读：

my_data <- read.csv("file_name")

它有很多列，但我希望得到行数，具有特定的列条件，例如行数，其中列的值为＃34; VAL＆＃34;是更大的20. 我试过了：

k <-subset(my_data, my_data$VAL > 24)
length(k)

但它看起来不正确。我不知道如何让它发挥作用。

Answer 1

如果你只对这些观察的数量感兴趣，那么我更喜欢简单地总结一个布尔矢量。 R的最大优势可能是矢量化操作，(df$y > 100)将为您提供一个向量，指示每个单独的观察是真还是假。然后，您可以对此求和以获得真实的总数。

x <- 1:10000
y <- rnorm(1000,100,10)
df <- as.data.frame(cbind(x,y)) #create a dataframe

count <- sum(df$y > 100)

Answer 2

dim(k)如果您需要保留数据框或dim(subset(my_data, my_data$VAL > 24))