解决此问题的可能算法

时间:2019-04-30 11:05:49

标签: algorithm graph tree nlp

我有一个提取的旅馆名称的列表,这些是n家网站关于同一旅馆的名称。该列表包含约1家酒店的m个名称。我必须根据正确性,相似性和更少的错误从列表中选择一个名称。我该如何实现? 任何方向都是有帮助的。

示例:hotelId 1 {“ ABC酒店”,“ CDE酒店”,“酒店ABC”,“ AB酒店”,“酒店BCA”的名称列表...}

通过初始研究,它看起来像一个与图相关的问题

2 个答案:

答案 0 :(得分:0)

这行不通。您不会根据名称获得相似性。特别是如果几乎每家酒店的名称中都带有关键字酒店。

您需要更多信息以匹配相似性。 地址,地理位置,有关酒店的属性(如果是连锁店等)也可能会有所帮助(无线网络,停车场,靠近海滩的地方,游泳池)。您拥有的信息越多,匹配结果就越好。

答案 1 :(得分:0)

您可以尝试利用Bing或Google API的一些->例如,使用搜索API或某些Map APIS中的地址搜索带有详细信息的酒店名称(例如搜索[“ ABC Hotel 5AV Philliadelphia”,然后将“ CDE hotel 5AV Philliadelphia”,“ Hotel ABC 5AV Philliadelphia”,..]然后将您的数据与API响应进行比较。