如何将单词与所选单词列表进行比较,以找到与最强单词相关的单词?

时间:2015-03-18 12:12:49

标签: r web-services nlp classification

我希望设计一个搜索框,它将接受任何输入,并从选定的输出列表中返回最合适的输出。

例如,我选择的输出列表为animalvehicleplace

如果用户搜索cat,我希望代码能够运行cat vs animalvehicleplace。将确定每个的相关/匹配分数。 animal生成最高相关性。输出将为animal

同样,输入car,将从列表中输出vehicle

有关生成此相关性分数的最佳方法的任何想法? 我的输出列表包含100个不同的术语。

1 个答案:

答案 0 :(得分:1)

您正在寻找分类器。 要么动态查找API,要么使用API​​来训练您的模型(如果您的模型没有命中,可以尝试使用API​​作为后备)。

e.g。一种方法是根据Is there any free online dictionary API (json/xml) with multiple languages to choose from?

中的答案使用维基词典

以下是 cat:English:Etymology 1:Noun 的条目,然后您只需要处理条目以发现动物/车辆/地点等关键字。这是可行的。

或者只是寻找动物,车辆,地方的在线列表。

还有许多其他API,大多数需要注册,有些是付费的。