应用错误收集

我有......

我想......

识别文本中存在的那些关键字/短语（例如Hi John, happy birthday to you.匹配birthday），最好是关于相等匹配数的一些信息
容忍语法变体（vacations应与vacation匹配，countries应与country匹配）或＆＃34;拼写错误＆＃34; （nodejs == node.js）。

本质上是某些类似的 Google用于搜索的内容（但它们可能使用更复杂的方法）或Stackoverflow用于标记匹配/搜索答案。

基本上用户输入了一些文字，我的程序应该最好建议相关的关键字。

在我的情况下，算法需要主要使用英文文本，但也应适用于其他语言，如德语，意大利语，法语，西班牙语......

是否存在可以执行此操作的某些Linux / NodeJS库？或者至少是一个众所周知的算法？