清理位置数据

时间:2012-12-03 10:17:22

标签: facebook search linkedin

我有一个城市名称数据库,但问题是它没有消毒。例如,如果班加罗尔,印度是一个城市,那么我的数据库中可能有以下位置:

  1. 班加罗尔
  2. 印度班加罗尔
  3. 印度Bangulore(拼错)
  4. 班加罗尔,印度顶级城市
  5. 班加罗尔,大都会,印度
  6. 现在我想清理这些数据,以便在卫生设施之后留下的唯一条目是“班加罗尔,印度”。 我可以使用LinkedIn或Facebook拥有的数据,但我不知道这是否可行?另一种方法可能是拥有城市名称的主列表并基于此进行消毒,但这似乎是一种代价高昂的方法。理想情况下,当我将任何城市名称(正确或不正确)作为输入传递时,我正在寻找能够从正确的数据集返回最匹配城市的服务。任何指针都会受到赞赏。

0 个答案:

没有答案