如何为每种产品找到合适的类别?

时间:2010-02-22 16:40:49

标签: algorithm

我需要向数百个网站提交数百种产品。对于大多数网站,我需要为每个产品选择一个目录/类别。但似乎每个网站都有不同的类别定义。例如,一些笔记本电脑在计算机/硬件下列出,一些在电脑/笔记本电脑下,一些在电子/电脑下,一些在电子/电脑下。

很难自动为每个产品选择一个类别。你能给我一些建议吗?

非常感谢你!

2 个答案:

答案 0 :(得分:2)

是的,这很难。没有人同意这些类别。

Unix“rm”命令(“remove”)在Windows中拼写为“del”。为什么?人们不同意那些简单明了的事情。

你想要什么样的魔法?您的任务需要 思考

一个人必须(1)了解您的产品和(2)了解网站类别,然后(3)根据理解选择正确的类别。思考并做出判断。

由于网站类别只是单词,因此您的软件可能必须猜测并假设某些含义。 “家庭”或“消费者”是什么意思?只有在上下文中才能猜出其含义。

答案 1 :(得分:0)

我会尝试使用同义词和概括来构建图表。例如,NotebookLaptop是同义词。 Computer概括了他们。 PCComputer的同义词。 Electronics再次概括Computer(及其同义词PC)。

现在,对于给定的产品,请查看可用类别的最深层次,并从图表中查找该产品的最具体的同义词。如果没有匹配,请向上移动一级,因为它们可能具有更多特定类别,然后您绘制图表 - 例如,它们可能按品牌划分笔记本。当您在没有匹配的情况下到达类别的根目录时,请从图表中进行第一次概括,然后再从最深的类别级别向上搜索。

此解决方案仍然存在问题,因为例如类别可能会在很高级别或非常深层次上按品牌划分,您在构建图表时会选择一个选项。处理这种情况也很有可能,但它会变得更加棘手。