我想使用Python找到两个单词之间的相关性(不相似)。 hso(Hirst和St-Onge,1998),lesk(Banerjee和Pedersen,2003)和vector(Patwardhan,2003)算法都在Perl here中实现,但我似乎无法在Python中找到相同的nltk lib。
我需要使用Python,因为它是Python中一个更大的团队项目的一部分。任何线索??
答案 0 :(得分:4)
还有一个可以访问的Web界面 - 您可以编写一个python客户端来查询Web界面以获取lesk或vector值。
您可以在这里找到这些网络界面......
http://marimba.d.umn.edu http://talisker.d.umn.edu
祝你好运, 泰德答案 1 :(得分:4)
我使用NLTK将WordNet加载到Neo4j图数据库中(参见https://groups.google.com/d/topic/gremlin-users/C1OlTG9xCpo/discussion)。
我使用Bulbs(http://bulbflow.com/)创建了一个名为WordGraph的库,用于通过Rexster REST服务器(https://github.com/tinkerpop/rexster/wiki/)与Neo4j / WordNet进行交互。
Bulbs是一个Python库,允许您使用图形编程语言Gremlin(https://github.com/tinkerpop/gremlin/wiki)来查询/遍历Neo4j,在本例中,特别是WordNet。
我正在将WordGraph发布到Github(https://github.com/espeed/wordgraph) - 如果您有疑问,请给我留言。
答案 2 :(得分:2)
如果你已经有perl实现,为什么不编写一个调用perl代码的python包装器呢?这样你的python项目就可以利用这些功能,而你不必重写实际的算法。 nltk中有很多东西已经以这种方式工作。