我有一个视频类,可以有许多与之关联的标签。前一段时间,我读了一篇关于设计模式的文章(或许这只是一种标准的做法),详细说明了通过查看有多少类似的两个视频类的最有效和准确的方法。他们与之关联的相同标签记录。
也许这不是一个很好的例子,因为我可以为每个视频订购/分组标签计数,但我当然记得读过这样的技术。 对不起这个问题的模糊性。
答案 0 :(得分:1)
不太确定这是不是你的意思,但我立刻想到了the Levenshtein distance。简而言之,这是从一个到另一个所需的编辑数量。 (因此,levenshtein距离越低,物体越相似)