我正在寻找.net中的工具/ api,它可以粗略地提取句子中的关键词。例如,如果我有一篇标题为“PIX:世界上最薄的15英寸笔记本电脑,戴尔XPS 15z”的文章,我想提取关键字,例如:戴尔,XPS 15z,笔记本电脑等,这样我就可以在其他文章中搜索这些关键词,并向用户展示类似的文章。
任何建议都表示赞赏。
答案 0 :(得分:2)
看看这里:
答案 1 :(得分:0)
如果您想搜索文本并展示相关文章,您可能会对Lucene.NET感兴趣。它将索引一组文本并接受标准的搜索引擎式查询。它甚至会对搜索结果进行谷歌风格的呈现,例如突出显示文档中的搜索词。
这比使用Tarkus提到的算法要多得多,但它可以解决更多的问题并使您免于编写自己的搜索引擎(这是一项非常重要的任务)。
答案 2 :(得分:0)
您还可以在正则表达式中使用分组来提取戴尔周围的字词。
答案 3 :(得分:0)
我一直在寻找这种工具,我找到了这个页面http://termcoord.wordpress.com/about/testing-of-term-extraction-tools/free-term-extractors/
您可以从任何工具中进行选择。这有助于我提供很多选择。