Python Context Free Grammar和PCFG生成基准测试?

时间:2013-05-27 05:18:14

标签: python nlp nltk context-free-grammar text-analysis

我知道在Python中有一些用于通用CFG和PCFG的函数;但是它们似乎都有不同的速度。

例如:NLTK,PyParsing。

是否有最新的基准测试比较与速度和内存使用相关的各种属性?

1 个答案:

答案 0 :(得分:0)

如果你正在寻找像其他计算软件一样的NLP工具的官方基准测试,你可能会深感沮丧。可悲的是,NLP的研究人员正在努力推动精确度系统的实现。 (在研究中说I score X% more than the state-of-art而不是I save Y hrs / days training my model肯定更好。

他们的研究论文中经常有一句话说明培训他们的系统需要多长时间,例如来自www.aclweb.org/anthology/P10-1116.pdf

In average, the sampling program run on the Wikipedia dump consumed 20G memory, and each round took about one week on a single AMD Dual-Core 1000MHZ processor.

无论如何,既然你想要一些基准,那么这里有一些你可以用googling =)www.aclweb.org/anthology/I11-1100做的功课。但是你又一次意识到他们是基准测量准确度而不是速度=)