在“数据集”列中的金额(缩写为“百万和十亿”)中如何删除和计算此列的平均值

时间:2019-06-01 06:17:40

标签: r

IN数据集列“收入”中的数值以$符号提及,并以“百万和十亿”的缩写形式出现。如何计算“收入”的平均值

enter code here
 B_l$revenue<-split(B_l$revenue, split="M", Split="B")/1000

1 个答案:

答案 0 :(得分:0)

一种选择是使用subsub删除“ B | M”并计算列的mean

mean(as.numeric(sub("B|M", "", B_l$revenue)), na.rm = TRUE)

或者使用parse_number提取数字部分,然后获取mean

library(readr)
mean(parse_number(B_l$revenue), na.rm = TRUE)

目前尚不清楚该部门。如果“ B”元素应除以1000

i1 <- grepl("B", B_l$revenue)
v1 <- parse_number(B_l$revenue)
v1[i1] <- v1[i1]/1000
mean(v1)