句子显着性得分和词频分布stanford-nlp

时间:2017-08-13 15:35:36

标签: java stanford-nlp

我正在使用stanford-nlp来分析新闻文章。

我需要计算单词频率分布以确定单词在文章中的重要性,以便我可以根据单词重要性/频率计算句子重要性分数。

我通过使用HashMap计算了文章中的单词频率,但我想知道stanford-nlp中是否有任何内容可以执行单词重要性和句子重要性的计算?

我在这个主题上找到的就是这份文件:

https://nlp.stanford.edu/fsnlp/intro/fsnlp-slides-ch1.pdf

Stanford CoreNLP中有什么能够表达这句话的意义吗?

由于

1 个答案:

答案 0 :(得分:0)

不幸的是,斯坦福CoreNLP中没有工具可以为您做这样的分析。

使用HashMap的实现似乎是一种可能的解决方案。我假设你计算你正在分析的文章中每个单词的频率。我不确切地知道你是如何计算重要性的,但你可能想要确定多字词并计算它们的频率。关于找到这样的多字词的主题有一篇很好的论文,你可以找到here