从R中间隔组织的数据中连续分布

时间:2013-11-09 11:12:58

标签: r intervals cut probability-density

我有以下问题。我的数据集如下:

Income              Numerosity
from 6000 to 7500       704790
from 7500 to 10000     1294784
from 10000 to 12000    1051902
from 12000 to 15000    1585132
from 15000 to 20000     704012
from 20000 to 25000     206901
from 25000 to 30000     156661

我想用连续密度函数来近似这些数据。 在R中有一个简单的方法吗?我在考虑像"反向"关于函数" cut"。

所做的事情的过程

1 个答案:

答案 0 :(得分:0)

我用这种方式解决了:首先我为每一行使用sample(6000:7500, 704790, replace=TRUE)来创建生成观察的向量。然后我将函数density应用于向量并获得我正在寻找的密度函数。肯定有更好更优雅的方法,但这很有用。