句子提取

时间:2013-05-09 15:53:19

标签: algorithm nlp

假设我有以下内容:

  • 句子列表(没有标点符号)
  • 一长串单词(没有标点符号)

我的目标是将此字符串细分为句子块,不包括不构成句子的单词。

我会想到一个特殊的解决方案,但觉得这可能是一个众所周知的问题(我的意思是建议实现一个有效的现有算法,比如最短路径问题等等。 ..)

那么,有这个算法吗?

修改 例句:

hello

how are you

what do you want

are you hungry

do you want to eat

are you thirsty

do you want to drink

what is your name

good morning

good night

示例输入字符串:

do do how are you eat

所以,how are you应该是输出。

(输入样本可能很奇怪,因为它是语音识别器输出)

感谢。

1 个答案:

答案 0 :(得分:0)