如何计算连续特征的信息增益

时间:2015-12-11 21:54:20

标签: image-processing machine-learning feature-extraction entropy information-extraction

如果我没有任何离散值,我在寻找信息增益的正确参数方面遇到了问题,因此我首先需要将这些点离散化为间隔。

我有什么

我正在进行图像处理,我的功能可能在0-255范围内。对于一些训练数据,我可以定义一些间隔(仅定义“是对象或不是对象”)。如果goods是匹配点的间隔数,则为bads标记其环境。我会用

这样计算

formula

此案例的信息收益:

formula

,其中

formula

结果和想法

出于某种原因,我最终得到了一个否定 IG,这是一个安静的废话,但我没有看到错误。另一个想法是,不计算good对象匹配间隔,而是计算适合任何良好间隔的good中的样本。

有人有想法吗?

1 个答案:

答案 0 :(得分:0)

我不知道你之前和之后(或P和Q)发行的内容。

你有什么改变从一种情况到另一种情况吗?目前还不清楚。

查看Python Linked List

似乎好+坏代表了整个发行。

所以你需要做一些改变,从一个(好的,坏的)转到另一个(好的,坏的)。

然后您正确应用公式 - 或按照示例

你的公式好像搞砸了。