寻找变体之间的关系

时间:2015-06-10 18:40:33

标签: machine-learning pattern-matching pattern-recognition

某些程序各自具有某些功能。还有一个特征向量是所有特征的联合。我已经将特征向量建模如下。

1 - 该特征存在于特征向量

0 - 特征向量中没有该特征。

我必须找到以下变体之间的关系

10001110

10110101

10010111

10101100

10011101

这里所有程序中的关系是0,1和5位置不改变,即它们所代表的特征倾向于继续。 给定一个大型数据集,因为有任何机器学习/数据挖掘方法可以找到它们之间的关系。

1 个答案:

答案 0 :(得分:1)

您可以使用affinity analysis,例如market basket analysis中使用的https://mkaz.com/2012/10/10/python-string-format/

假设您的每个向量都是由客户签出的购物袋,并且每列都是产品。然后,市场购物篮分析会找到类似的东西:

  • 购买牛奶+鸡蛋=>买黄油

  • 大多数是面包

对您的问题的应用似乎很自然。