IN数据集列“收入”中的数值以$符号提及,并以“百万和十亿”的缩写形式出现。如何计算“收入”的平均值
enter code here
B_l$revenue<-split(B_l$revenue, split="M", Split="B")/1000
答案 0 :(得分:0)
一种选择是使用sub
用sub
删除“ B | M”并计算列的mean
mean(as.numeric(sub("B|M", "", B_l$revenue)), na.rm = TRUE)
或者使用parse_number
提取数字部分,然后获取mean
library(readr)
mean(parse_number(B_l$revenue), na.rm = TRUE)
目前尚不清楚该部门。如果“ B”元素应除以1000
i1 <- grepl("B", B_l$revenue)
v1 <- parse_number(B_l$revenue)
v1[i1] <- v1[i1]/1000
mean(v1)