根据Discrete-State Variational Autoencoders for Joint Discovery and Factorization of Relations论文的作者,this dataset的第一个字段是训练句子的实体对之间的词汇化依赖路径。
什么工具(最好是在python中)可以从具有已识别的实体对的句子中提取这样的词汇化路径?
答案 0 :(得分:0)
您可以使用NLTK
NLTK被称为“教学和工作的绝佳工具, 使用Python的计算语言学,“和”一个惊人的库 玩自然语言。“
使用NLTK,您可以解析给定的句子,以获得其单词与其POS标签之间的依赖关系。
它没有提供直接获取那些词汇化依赖路径的方法, 但是它为你提供了编写自己的方法所需要的东西。