如何实现概率密度函数估计?

时间:2018-07-02 21:54:53

标签: machine-learning statistics data-mining probability probability-density

我有一组由一组功能(用实数表示)描述的对象。

对于给定的功能,我想确定其峰值,即高概率值集和局部最大值。我认为我可以通过估计每个特征的概率密度函数来做到这一点。

直觉上,我认为我们可以通过使用直方图来实现概率密度函数的估计。但是我不确定我是否正确。并且,当我们使用直方图时,我们需要定义一些参数(例如,bin大小)。我更喜欢一些需要较少参数的方法。

估计概率密度函数的最常用方法是什么,仅取决于几个参数?

1 个答案:

答案 0 :(得分:2)

您当然可以使用直方图来估计概率密度函数!但是,这会带来麻烦,具体取决于数据集的大小。例如,垃圾箱从哪里开始?

您听说过KDE估算吗?这里有很多要讨论的内容,但是下面的这两个链接应该为您提供很多见识: