标签: machine-learning classification
我需要构建一个分类算法,并将其用于由点x = {x_1,x_2,...,x_n}组成的数据,其中x_1等本身就是实验测量的量,因此具有后验分布。
我应如何考虑这种数据行为?我应该从嘈杂的数据开始训练算法吗?
答案 0 :(得分:0)
首先,您总是要从最简单/干净的数据开始。这将作为改进的参考。基本上,获取著名的IRIS数据集并在其上训练算法。将结果与已知的IRS数据集准确性进行比较。这应该是您的起点。