我正在寻找一种算法,在给定元组的第一个元素的情况下找到最可能的2元组。
最有可能的是,这两个元素之前在批处理中更常见。
假设您拥有无限的批次:
BATCH 1:
border
color
border-radius
dispaly
BATCH 2:
width
height
left
top
color
border
BATCH 3:
border
border-radius
width
height
BATCH 4:
[ and so on ... ]
批次不断流入,永无止境。该算法必须训练以便能够知道批次中每两个元素最有可能一起出现。
例如,当一个新批次进入时,我会问算法“请将批次分成一组2元组,因为它们可能属于一批。”
让我们说批号4如下:
BATCH 4:
border
width
border-radius
height
该算法会将批处理分成两个2元组,如下所示:
[border, border-radius]
[width, height]
因为历史上这些元素更可能在一个批次中。
算法不一定要精确,而是相当便宜并且可以对概率进行操作。
答案 0 :(得分:1)
它被称为频繁的2项目集。
但是由于元组限制,它只是归结为计数。