根据某些标准过滤文本内容,例如关于我自己

时间:2009-10-17 00:22:39

标签: algorithm

如果我有一组博客文章的话,在哪些专业领域,我想过滤掉那些可能与我有关或根据某些标准无关的内容?我知道我可以有一个要查找的单词列表(其中很多是关于我自己或其他任何东西 - 其他组合 - 组合不会结束),进行我的过滤,但这不是可扩展的策略。 levenschtein算法也会派上用场,但我认为这是一个完整的研究领域?

由于

1 个答案:

答案 0 :(得分:1)

这可能有用:

The Anatomy Of A Search Engine