我正在尝试编写一个查询,该查询将找到用户个人资料的最佳匹配讨论。
这里有两张表:
线程表 - 每个线程都标有数字标记(在单独的列中为tagid1,tagid2 ... tagid10)。每个tagid基本上都是线程中出现的关键字。 我们也有突出(在单独的列 - prominence1,prominence2 ... prominence10) - 这是关键字出现在线程中的次数。
For example:
threadid 123
tagids 1234, 12345, 12234, 11232, 11232, 112343, 1123224
prominence 2, 3, 1, 4, 5, 6, 2
用户表 - 每个用户标识都标有数字标记(在单独的列中为tagid1,tagid2 ... tagid10),这些用户最突出(在单独的列中 - prominence1,prominence2 ... prominence10)。 这里的显着性是根据用户参与具有特定标记的线程的次数来计算的。
For example:
userid 12334
tagids 1234, 5654, 45476, 4553, 44653, 6456432, 645645
prominence 6, 3, 2, 5, 2, 6, 1
如果我们有这两组数据 - 如果必须显示最佳匹配线程列表,如何为每个用户配置文件找到最匹配的线程?
请帮助,我需要一些指向需要用来找到最佳匹配的逻辑的方向。