鉴于一组文字和几个关键字,我想确定哪个关键字最相关。所以我基本上想要查看哪个关键字出现次数最多,但它比这更复杂,因为我想以复数形式和非复数形式搜索关键字并删除像"和"和""。
我可以写一个函数来做一个体面的工作,但不是重新发明轮子我想知道是否有一个好的nlp库,理想情况下在JS中,处理这种事情,即关键字相关性。在这种情况下,准确性比性能更重要,但两者都很重要。
为了给出一个具体的例子,在顶部用黄色突出显示的三个关键词," disney"应该与文章中出现的最相关,因为它在文章中出现次数最多,并且对文章最具体。 https://www.guide.com/gift-guide-for-all-the-disney-fanatics-in-your-life/a
答案 0 :(得分:1)
Natural是一个很好的自然语言处理库。 https://github.com/NaturalNode/natural。这里有一个很好的免费课程https://egghead.io/courses/natural-language-processing-in-javascript-with-natural。