如何使用Python在Wordnet中找到相关性

时间:2011-09-07 14:37:13

标签: python nltk similarity wordnet

我想使用Python找到两个单词之间的相关性(不相似)。 hso(Hirst和St-Onge,1998),lesk(Banerjee和Pedersen,2003)和vector(Patwardhan,2003)算法都在Perl here中实现,但我似乎无法在Python中找到相同的nltk lib。

我需要使用Python,因为它是Python中一个更大的团队项目的一部分。任何线索??

3 个答案:

答案 0 :(得分:4)

还有一个可以访问的Web界面 - 您可以编写一个python客户端来查询Web界面以获取lesk或vector值。

您可以在这里找到这些网络界面......

http://marimba.d.umn.edu http://talisker.d.umn.edu

祝你好运, 泰德

答案 1 :(得分:4)

我使用NLTK将WordNet加载到Neo4j图数据库中(参见https://groups.google.com/d/topic/gremlin-users/C1OlTG9xCpo/discussion)。

我使用Bulbs(http://bulbflow.com/)创建了一个名为WordGraph的库,用于通过Rexster REST服务器(https://github.com/tinkerpop/rexster/wiki/)与Neo4j / WordNet进行交互。

Bulbs是一个Python库,允许您使用图形编程语言Gremlin(https://github.com/tinkerpop/gremlin/wiki)来查询/遍历Neo4j,在本例中,特别是WordNet。

我正在将WordGraph发布到Github(https://github.com/espeed/wordgraph) - 如果您有疑问,请给我留言。

答案 2 :(得分:2)

如果你已经有perl实现,为什么不编写一个调用perl代码的python包装器呢?这样你的python项目就可以利用这些功能,而你不必重写实际的算法。 nltk中有很多东西已经以这种方式工作。