我使用过ClausIE,它从句子中返回主语,动词和宾语三元组。但是当文本是短文本而不是完整的句子时,这些将不起作用。我只想要一个库或其他只能从短文本/短语中返回主题动词对的文件。
示例简短文字是“接受建议32”。它应该有一些依赖或用于确定术语“提案”是主语的术语,而“接受”一词是动词/关系。
我已经为上面的文本尝试了斯坦福在线解析器,但它没有返回任何内容,因为文本中没有对象。
任何建议都将受到赞赏。
答案 0 :(得分:0)
问题是,你有一个主题("提议32")和一个动词("被接受")。因为你没有对象,所以没有三元组。
但是,你可以做的是尝试使用Tokenization,使用斯坦福在线识别主语和动词
例如:
- 句子可能是#34;声明的"如果斯坦福使用" S"标签。
- 如果判决是陈述性的,那么:
- 主题通常是主要动词组前面的名词组。在斯坦福大学的网上,这是第一个副总裁面前的第一个NP。
现在:如果你:
- 添加"是"在你得到的主要动词前面:"接受提案32"。
- 这是:"提案32 =已接受",这是任何编程语言理解的逻辑比较
问题当然是,你不总是得到这些简单的短句。可能有一些可以处理这种开箱即用的包。但不是我所知道的。
你能做什么:根据英语语法制定自己的一些规则。它只会理解你制定的规则的句子。但也许这就是你所需要的。如果您只需处理这些非常短的组合,一些精心设计的规则就可以完成这项工作