如果手动使用k-mean算法的示例,你将如何解决sqared误差?
我正在尝试解决如何对特定数据集使用平方误差。
所以我想知道他们如何得到平方误差的值为“14.5”,“15.94”和“9.60”
据我所知,群集中心是x和y的群集点值的平均值,群集点是每个实例。但我不明白他们是如何解决平方错误的。
答案 0 :(得分:1)
"平方误差"相对于其中心C的点P是P和C之间的距离的平方;即,(Px-Cx)^ 2 +(Py-Cy)^ 2.
整个聚类的平方误差是所有点的计算总和。例如,结果1的平方误差计算如下。
Px Cx Py Cy
(1.0 - 2.67)^2 + (4.5 - 4.67)^2
+ (2.0 - 2.67)^2 + (3.5 - 4.67)^2
+ (5.0 - 2.67)^2 + (6.0 - 4.67)^2
+ (1.0 - 2.00)^2 + (1.5 - 1.83)^2
+ (2.0 - 2.00)^2 + (1.5 - 1.83)^2
+ (3.0 - 2.00)^2 + (2.5 - 1.83)^2