mysql组基于标题和描述重复

时间:2010-11-22 21:29:54

标签: php mysql

Indeed.com分组按标题和说明重复招聘职位。 Here就是我所说的一个例子。我该怎么做呢?它只是一个简单的Group By语句或完全不同的东西吗?

2 个答案:

答案 0 :(得分:1)

可以使用一个简单的组来完成,但这只会对完全匹配进行分组。

您可以测试几个参数来确定是否对条目进行分组。在他们的示例中:公司名称,位置和关键字。

“其他完全”将涉及分析一行的字段以确定它们与另一行的相似性。我认为这可能是处理器密集型的,无法大规模集成。

答案 1 :(得分:1)

我不确定你在示例中看到了什么。但是在类似描述的东西上做一个sql组是没有意义的。这将导致大量开销,特别是在数据量确实跟踪的情况下。

一种存储数据的好方法,类似于文件索引存储的内容,尝试使用google搜索solr或nosql。