PHP有一个lemmatizer吗?

时间:2013-09-18 19:26:35

标签: php

有人知道PHP中的lemmatizer吗?或者,在最糟糕的情况下,某种方式在PHP webapp中使用另一种语言(例如python NLTK?)的词形变换器?

我正在构建a macro-etymological analyzer并且我遇到了这个问题,其中词源数据库不包含共轭词。我认为,当词典找不到“说”时,一个词形变换器会给我一个“说”这个词,当词典找不到“更好”时,它会返回“好”,等等。

注意:一个词干分析器不会像一个词形变换器那样做。

4 个答案:

答案 0 :(得分:0)

这有帮助吗?

http://tartarus.org/~martin/PorterStemmer/php.txt

这是Porter Stemmer算法的PHP5实现。

答案 1 :(得分:0)

我用Google搜索了这个:

http://pastebin.com/WNvb2zB4

和此。

http://tartarus.org/~martin/PorterStemmer/php.txt

dunno,如果其中任何一个有效。

答案 2 :(得分:0)

答案 3 :(得分:0)

与词干相比,Lemmatisation相对更复杂,这就是为什么找到一些现成的免费解决方案更难的原因。

我看到没有人回答子问题。

  

在PHP webapp中使用另一种语言的词形变换器(例如python NLTK?)的某种方法

php至少有exec并且调用相同。人们可以简单地运行任何外部脚本或应用程序。

php中有一些“lemmatizers”可以在互联网上找到,但是快速检查一下这些是“词干”。

确保,Stemming不适合你。确保您已经用其他语言考虑的解决方案是Lemmatizer。

我怀疑接近这个命名的所有解决方案都是用C语言编写的。如果它们是开源的或作为库提供,您可以将它们构建为PHP作为扩展。