在大文本句子语料

时间:2018-05-26 14:31:03

标签: string algorithm text

我是初学者,我想知道是否有办法在大型文本数据序列(例如100万)中搜索文本句子,并相应地搜索用户类型:

  

我不应该在那里

然后它应该搜索这样的序列:

  

我不应该在那里

类似这样:

  

我要去那儿。

  

我会去那里。

我一直想着用几天来解决这个问题 问题

如果您对如何处理此问题了解任何信息,请提供解决方案,否则只需提示即可。谢谢。

1 个答案:

答案 0 :(得分:0)

我首先要通过句子和文本来取代所有的长收缩形式。然后使用Knuth-Morris-Pratt。