java - TextRank运行时

时间：2012-01-06 23:14:25

标签： java graph nlp jgrapht opennlp

我在java中实现了textrank但似乎很慢。有谁知道它的预期表现？

如果预计不会很慢，可能会出现以下任何问题：

1）似乎没有办法在JGraphT时间创建边缘并在其中添加重量，所以我计算了重量，如果它是＆gt; 0，我添加一个边缘。我稍后重新计算权重，以便在循环边缘时添加它们。这是一个糟糕的主意吗？

2）我正在使用JGraphT。这是一个缓慢的图书馆吗？

3）我能做些什么才能让它更快？

答案 0 :(得分：1)

这取决于你的意思“非常慢”。一段谷歌搜索发现了这一段：

“我们计算了RAKE和TextRank的总时间（平均超过100个）从Inspec测试集500个摘要中提取关键字，之后从文件中读取摘要并加载到内存中.RAKE提取的密钥 - 500个摘要中的单词，160毫秒.TextRank提取关键字的时间为1002毫秒，是RAKE时间的6倍。“

因此，我推断一个不错的TextRank实现应该能够在~1秒内从~500个摘要中提取关键字。