我想使用机器学习来确定信号是否良好'或不。目前我认为我的方法应该是训练分类器,首先要识别信号存在于N个类别(N未知),然后确定是否有任何新流量适合N个类别中的任何一个或没有。我知道我可以做一些无监督学习的形式来确定N类别,如果我有一套已知的有效的'信号。我知道然后我可以使用贝叶斯分类器来确定是否有任何新信号出现在N组中的一组中,但我不确定贝叶斯分类器是否也可以告诉我任何“不好”的分类器。信号不能分为N组中的任何一组。此外,我不确定我的方法是否是最好的方法。
答案 0 :(得分:1)
我会使用生成模型,例如RBM。这可以采用一个输入数据点并告诉你它到目前为止给出的训练数据集的可能性是多少(假设你只训练好的信号)。或者,计算与“良好输入”的平均相似度。那些不同的人可能会很吵。或计算每个字段的标准偏差,并使用它来通知您有多少和新的示例偏离标准。您所描述的可能是异常检测问题。虽然@vicsana声称没有免费午餐,但对这个领域进行一些研究可能会指出你正确的方向。