我正在使用stanford-nlp来分析新闻文章。
我需要计算单词频率分布以确定单词在文章中的重要性,以便我可以根据单词重要性/频率计算句子重要性分数。
我通过使用HashMap计算了文章中的单词频率,但我想知道stanford-nlp中是否有任何内容可以执行单词重要性和句子重要性的计算?
我在这个主题上找到的就是这份文件:
https://nlp.stanford.edu/fsnlp/intro/fsnlp-slides-ch1.pdf
Stanford CoreNLP中有什么能够表达这句话的意义吗?
由于
答案 0 :(得分:0)
不幸的是,斯坦福CoreNLP中没有工具可以为您做这样的分析。
使用HashMap的实现似乎是一种可能的解决方案。我假设你计算你正在分析的文章中每个单词的频率。我不确切地知道你是如何计算重要性的,但你可能想要确定多字词并计算它们的频率。关于找到这样的多字词的主题有一篇很好的论文,你可以找到here。