我是(非常)新的NLP领域,我试图寻找一个API(在Java中) 可以告诉我两个文本是否具有相同的含义(或者如果一个文本是由另一个文本派生的) 例如:
“比利说汤姆是一个好孩子”
与
相同“根据比利,汤姆是一个好孩子”
我检查了GATE
和openNlp
,似乎GATE
只提供了注释API
并且openNlp
也不支持它。
答案 0 :(得分:3)
我建议你先做一些小任务,然后逐步完成这项庞大的任务。 有关指示,请参阅this question和the answers.com page on nlp。 Textual Entailment,一个活跃的研究领域,可能接近你所要求的。
答案 1 :(得分:0)
您可以尝试使用Cortical.io的Retina API:它使用多个距离测量(余弦相似度,提花距离,欧几里德距离......)来测量任何两个文本的语义相似性。您甚至可以直观地表示语义重叠。