分组常见搜索结果标题

时间:2012-01-19 14:46:01

标签: python ruby search

我有一系列新闻标题(只是字符串),我从多个新闻来源(我公司支付的一些)中检索到了这些新闻标题。标题通常是相似的,但不是逐字逐句。我想尝试将它们与Google新闻的方式相提并论。

有没有算法可以做到这一点?我可以使用ruby或python来创建这个脚本。

谢谢!

1 个答案:

答案 0 :(得分:1)

对于Ruby,请查看text gem,特别是两个字符串之间的Levenshtein distance