如果我没有任何离散值,我在寻找信息增益的正确参数方面遇到了问题,因此我首先需要将这些点离散化为间隔。
我有什么:
我正在进行图像处理,我的功能可能在0-255范围内。对于一些训练数据,我可以定义一些间隔(仅定义“是对象或不是对象”)。如果goods
是匹配点的间隔数,则为bads
标记其环境。我会用
此案例的信息收益:
,其中
结果和想法:
出于某种原因,我最终得到了一个否定 IG,这是一个安静的废话,但我没有看到错误。另一个想法是,不计算good
的对象匹配间隔,而是计算适合任何良好间隔的good
中的样本。
有人有想法吗?
答案 0 :(得分:0)
我不知道你之前和之后(或P和Q)发行的内容。
你有什么改变从一种情况到另一种情况吗?目前还不清楚。
似乎好+坏代表了整个发行。
所以你需要做一些改变,从一个(好的,坏的)转到另一个(好的,坏的)。
然后您正确应用公式 - 或按照示例
你的公式好像搞砸了。