从段落中提取关键字

时间:2014-07-04 06:13:17

标签: java stemming text-classification

我想从文字中提取关键字。我的文章必须与音乐,体育,农业等有关。所以我想要的是从一个段落中提取关键词。我想用Java做这个,我搜索了很多但是无法找到任何好的算法或程序来做这件事。

搜索后我发现python中有关键字提取算法。但我需要在Java中这样做。  我目前所做的是

1)Divided a paragraph into sentences.
2)Removed stop-words
3)calculated word frequency of each sentence.

但问题是我们不能说具有最大词频的句子将是主句。我也计划用摘要来从段落中提取主要句子。现在我完全坚持这个。任何人都可以帮助我。任何帮助将不胜感激。

0 个答案:

没有答案