是否有算法将多个句子组合成一个更复杂的句子?

时间:2015-05-20 13:34:47

标签: algorithm nlp

我希望与此处描述的内容相反:Tools for text simplification (Java) Finding meaningful sub-sentences from a sentence

即,取两个简单的句子并将它们组合成一个复合句。

有没有算法可以做到这一点?

1 个答案:

答案 0 :(得分:1)

我特别相信你不能像链接问题(John played golf. John was the CEO of a company. -> John, who was the CEO of a company, played golf)那样复合句子中的句子,因为它需要的语言理解距离现在太远了。

所以,似乎最好的选择是直接用逗号替换点并连接简单的句子(如果你必须选择从文本复合的句子,你可以尝试简单的启发式,如通过常用词的数量来近似语义相似性或像那些基于WordNet的工具)。我想,在大多数情况下,人类读者可以从上下文中推断错过的结合。

当然,您可以开发更复杂的解决方案,但它需要窄域(例如,所有句子共享非常相似的结构),或者可以确定句子之间关系的工具,例如,因果关系。我不知道这些工具和它们存在的疑问,因为这个级别(句子和短语)比单词和搭配的级别更加多样化和稀疏。