关于实施的文本搜索问题

时间:2010-07-21 20:21:42

标签: full-text-search mapreduce

有人可以解释一下文本搜索算法的工作原理吗?我理解它是一个巨大的领域,但我试图从高层次了解它,以便我可以查阅它的学术论文。 例如,拼写错误是一个难以解决的问题,当然谷歌解决了这个问题。当我搜索一个术语并在Google上拼错它时,它会自动显示正确的拼写。索引是如何完成的?使用MapReduce我可以看到他们索引各种实体。他们或其他人索引和存储什么?如果我正在考虑正确的方向,我可能正在寻找MapReduce的实际实现。

  • 帕乌

1 个答案:

答案 0 :(得分:0)

我担心这个问题确实太大了,这可能解释了为什么它还没有找到答案。就Google的拼写检查而言,Peter Norvig解释了它是如何完成的:How to Write a Spelling Corrector

Google生产使用的确切实现肯定看起来有点不同而且更复杂,但这可能会让你开始。