我有一个200行乘6列的数据框。我有兴趣计算Col A中的值小于特定数字的总时间。该号码可以硬编码。我不知道从哪里开始...
答案 0 :(得分:6)
要计算低于某个数字的值,您可以使用?sum
sum( df$columnA < NUMBER )
答案 1 :(得分:5)
对于稍微复杂的问题,使用“which”来告诉“sum”在哪里求和: 如果DF是数据框:
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 97 267 6.3 92 7 8
3 97 272 5.7 92 7 9
示例:总结Solar.R(第2列)的值,其中Column1或Ozone> 30 AND Column 4或Temp> 90
sum(DF[which(DF[,1]>30 & DF[,4]>90),2])
答案 2 :(得分:3)
只需在你的条件下使用总和即可。逻辑值转换为0表示FALSE,1表示TRUE,因此通过逻辑求和可以告诉您有多少值为TRUE。
dat <- as.data.frame(matrix(1:36,6,6))
colnames(dat) <- paste0("Col", LETTERS[1:6])
dat$ColA
# [1] 1 2 3 4 5 6
dat$ColA < 3
# [1] TRUE TRUE FALSE FALSE FALSE FALSE
sum(dat$ColA < 3)
# [1] 2
答案 3 :(得分:1)
虽然答案sum( df$columnA < NUMBER )
是正确的,但稍微扩展它可能会更好。
如果您想要对值进行求和而不是计算可以使用:
sum(df[df$columnA < Number,]$columnA)
或者如果使用NA
值:
sum(df[df$columnA < Number,]$columnA, na.rm=TRUE)
sum(df[(df$columnA < Number)&(!is.na(df$columnA)),]$columnA)
基本上会发生什么,你创建一个columnA的布尔向量,它基于你的条件具有TRUE / FALSE。然后,您将获取原始数据帧的子集,并在此情况下使用它来对columnA进行求和。
以下是您可以尝试使用的示例:
df = data.frame(colA=c(1, 2, 3, 4, NA), colB=c('a', NA, 'c', 'd', 'e'))
# Count
sum(df$colA) # NA
sum(df$colA, na.rm=TRUE) # 10 This is actually sum of values since colA wasn't turned into vector of booleans
sum(df$colA > 0, na.rm=TRUE) # 4
sum(df$colA > 2, na.rm=TRUE) # 2
sum((df$colA > 2) & (df$colB == 'd'), na.rm=TRUE) # 1
# Sum of values
sum(df$colA, na.rm=TRUE) # 10
sum(df[df$colA > 0,]$colA, na.rm=TRUE) # 10
sum(df[df$colA > 2,]$colA, na.rm=TRUE) # 7
bn_vector = (df$colA > 2)&(df$colB=='d') # Boolean vector
sub_df = df[bn_vector,] # Subset of the dataframe. Leaving the second argument in [] empty uses all the columns
sub_df_colA = df[bn_vector, 'colA'] # Content of column 'colA' which is vector of numbers
sum(sub_df$colA) # 4
sum(sub_df_colA) # 4
答案 4 :(得分:-1)
臭氧<-c(41,97,97)
Solar.R <-c(190,267,272)
风<-c(7.4,6.3,5.7)
温度<-c(67,92,92)
每月<-c(5,7,7)
Day <-c(1,8,9)
tbl <-data.frame(臭氧,太阳能,风,温度,月,日,天)
tbl
臭氧| Solar.R |风|温度|月|天 1 41 | 190 | 7.4 | 67 | 5 | 1个 2 97 | 267 | 6.3 | 92 | 7 | 8 3 97 | 272 | 5.7 | 92 | 7 | 9
sum(tbl $ Temp)/ sum(!is.na(tbl $ Temp))
[1] 84