TextRank运行时

时间:2012-01-06 23:14:25

标签: java graph nlp jgrapht opennlp

我在java中实现了textrank但似乎很慢。有谁知道它的预期表现?

如果预计不会很慢,可能会出现以下任何问题:

1)似乎没有办法在JGraphT时间创建边缘并在其中添加重量,所以我计算了重量,如果它是> 0,我添加一个边缘。我稍后重新计算权重,以便在循环边缘时添加它们。这是一个糟糕的主意吗?

2)我正在使用JGraphT。这是一个缓慢的图书馆吗?

3)我能做些什么才能让它更快?

1 个答案:

答案 0 :(得分:1)

这取决于你的意思“非常慢”。一段谷歌搜索发现了这一段:

  

“我们计算了RAKE和TextRank的总时间(平均超过100个)从Inspec测试集500个摘要中提取关键字,之后从文件中读取摘要并加载到内存中.RAKE提取的密钥 - 500个摘要中的单词,160毫秒.TextRank提取关键字的时间为1002毫秒,是RAKE时间的6倍。“

(有关上下文,请参阅http://www.scribd.com/doc/51398390/11/Evaluating-ef%EF%AC%81ciency。)

因此,我推断一个不错的TextRank实现应该能够在~1秒内从~500个摘要中提取关键字。