我正在尝试根据拍摄地点和拍摄时间对照片进行聚类。我的聚类算法要求我在每两个点之间定义一个距离函数(在这种情况下,每两个图片。)
对时间参数进行良好转换的想法吗?我已经考虑过使用欧几里德距离作为Lat / Long,但是我不知道时间参数需要哪个变换来计算受时间影响的距离。
答案 0 :(得分:1)
尝试使用例如DBSCAN。如果你看一下通用版本(GDBSCAN),很明显你也可以定义两个阈值参数,一个空间阈值(比如100米)和一个时间阈值(例如1天)at同时。
这是DBSCAN在广义DBSCAN框架内的直接扩展。
使用索引加速算法会有点棘手,但ELKI应该足够灵活,允许这样的扩展并且非常快。
对于Lat / Long,不要在纬度经度上使用欧几里德距离。如果您首先将数据投影到本地坐标系(例如单个UTM区域)(如果您的数据跨越整个地球,则无效),这没关系。但是使用其中一个大圆近似值。 ELKI已经为此提供了索引支持,您应该能够轻松添加时间组件(特别是,因为您只需要阈值)。