我有许多坐标点,每个坐标点都与特定的地标相关联,但是它们具有不同且未知的准确度。对于这些地标,我都有一个访客说他们在地标时的坐标。
我想使用“在地标”坐标来为将来的访客提高地标的准确性。但是,当我更改聚类算法的参数时,实际上,我真的无法知道我是否正在平均改善对现有位置进行实际改善的可能性。
我想创建一个目标函数,可以将其用作代理-有什么想法吗?
请注意,由于地标地址不正确,因此Google Maps API调用可能不可靠。
答案 0 :(得分:0)
一个例子是高斯混合模型的后验。您可以在此处找到一些示例:https://ch.mathworks.com/help/stats/clustering-using-gaussian-mixture-models.html
当然还有其他聚类算法。您正在使用哪一个?
答案 1 :(得分:0)
如果您想将所有这些用户标签减少为一个坐标,我建议(在日期栏除外)仅使用中位数。
原因是中位数具有很高的分解点,即对异常值很强。