Indeed.com分组按标题和说明重复招聘职位。 Here就是我所说的一个例子。我该怎么做呢?它只是一个简单的Group By
语句或完全不同的东西吗?
答案 0 :(得分:1)
可以使用一个简单的组来完成,但这只会对完全匹配进行分组。
您可以测试几个参数来确定是否对条目进行分组。在他们的示例中:公司名称,位置和关键字。
“其他完全”将涉及分析一行的字段以确定它们与另一行的相似性。我认为这可能是处理器密集型的,无法大规模集成。
答案 1 :(得分:1)
我不确定你在示例中看到了什么。但是在类似描述的东西上做一个sql组是没有意义的。这将导致大量开销,特别是在数据量确实跟踪的情况下。
一种存储数据的好方法,类似于文件索引存储的内容,尝试使用google搜索solr或nosql。