按时间和位置对图片进行聚类

时间:2013-07-22 13:21:30

标签: cluster-analysis euclidean-distance

我正在尝试根据拍摄地点和拍摄时间对照片进行聚类。我的聚类算法要求我在每两个点之间定义一个距离函数(在这种情况下,每两个图片。)

对时间参数进行良好转换的想法吗?我已经考虑过使用欧几里德距离作为Lat / Long,但是我不知道时间参数需要哪个变换来计算受时间影响的距离。

1 个答案:

答案 0 :(得分:1)

尝试使用例如DBSCAN。如果你看一下通用版本(GDBSCAN),很明显你也可以定义两个阈值参数,一个空间阈值(比如100米)和一个时间阈值(例如1天)at同时。

这是DBSCAN在广义DBSCAN框架内的直接扩展。

使用索引加速算法会有点棘手,但ELKI应该足够灵活,允许这样的扩展并且非常快。

对于Lat / Long,不要在纬度经度上使用欧几里德距离。如果您首先将数据投影到本地坐标系(例如单个UTM区域)(如果您的数据跨越整个地球,则无效),这没关系。但是使用其中一个大圆近似值。 ELKI已经为此提供了索引支持,您应该能够轻松添加时间组件(特别是,因为您只需要阈值)。