具有较大数据集的正常曲线的直方图

时间:2012-06-12 13:47:08

标签: r histogram

我是R的新手,我正在尝试绘制以下数字的直方图

INPUT.TXT

a b c 1.111 
d e f 2.3433 
g h i 9.87667 
............ 
............

总记录 - 2444910

最大值 - 142701.38999976

所以,我已经尝试了这个

setwd ("/path/")
data <- read.table ("input.txt", sep="\t", header=F)
x <-data$V4
bins = seq(0,150000,by=10000)
h <- hist(x, breaks=bins, probability=TRUE)
s = sd(x)
m = mean(x)
curve(dnorm(x, mean=m, sd=s), add=TRUE, lwd=3, col="red")
lines(density(x), col="blue")
abline(v=mean(x),col="blue")
mtext(paste("mean ", round(mean(x),1), "; sd ", round(sd(x),1), "; N ",length(x),sep=""), side=1, cex=.75)
dev.off()

但是,我只能在(0,0)坐标附近得到一个直方图条。任何帮助都表示赞赏。

1 个答案:

答案 0 :(得分:0)

dat <- data.frame(V4=c(runif(10000, 1,5000), 149999))
hist(dat$V4, breaks=c(seq(0,5000,100), 150000) )

排除异常值:

hist(dat$V4[dat$V4 <5000], breaks=c(seq(0,5000,100)) )