某些程序各自具有某些功能。还有一个特征向量是所有特征的联合。我已经将特征向量建模如下。
1 - 该特征存在于特征向量
中0 - 特征向量中没有该特征。
我必须找到以下变体之间的关系
10001110
10110101
10010111
10101100
10011101
这里所有程序中的关系是0,1和5位置不改变,即它们所代表的特征倾向于继续。 给定一个大型数据集,因为有任何机器学习/数据挖掘方法可以找到它们之间的关系。
答案 0 :(得分:1)
您可以使用affinity analysis,例如market basket analysis中使用的https://mkaz.com/2012/10/10/python-string-format/。
假设您的每个向量都是由客户签出的购物袋,并且每列都是产品。然后,市场购物篮分析会找到类似的东西:
购买牛奶+鸡蛋=>买黄油
大多数是面包
对您的问题的应用似乎很自然。