Elasticsearch建议一个拥有大量用户的位置

时间:2017-03-20 09:25:31

标签: elasticsearch

假设我有一份User的文件如下:

{  
  id,  
  first_name,  
  last_name,  
  geo // Current location of an online user.  
}

我想搜索具有'geo'的特定用户,该用户在半径1km范围内被许多用户包围。例如,有很多用户访问某个地方,因为那里有一个活动,我想建议我们的用户“你应该看看那个地方”。但是,我们唯一知道的是在线用户的地理价值,因此,我们需要有一种方法来检查这些用户是否一次全部关注一个点。 我可以使用elasticsearch来执行这样的查询吗?我该怎么做?

1 个答案:

答案 0 :(得分:1)

我假设你要找的算法是K-means。如果是这样的话那就有Elastic github feature-ticket,它的目的是从Elastic本地解决这个案例,但还没有解决。

有几个ML库与Elastic有机地集成在一起。其中一个是spark-elastic。我确定您可以根据问题集的其他见解找到相似内容: - )

尽管如此,我想提一下K-means算法要求您提前提供K(所需数量的聚类)。这需要额外的领域知识专业知识或只是尝试。即可能会发生这样的情况:在一种情况下,您会将文档聚类为,让我们说5个聚类,而在另一种情况下,更合适的是10.只是大声思考:)