使用python在事务中查找序列模式

时间:2015-04-05 17:11:26

标签: python data-mining

我有给定形式的数据:

Date       | Products
2014-01-01 | A,B,C,D
2014-01-02 | M,N
2014-01-03 | B,X
2014-01-06 | M
2014-02-07 | F,B
2014-02-09 | M,A

我想使用一些算法来识别M主要在B之后购买,即B和M有一些关联。这里有没有人解决过这类问题?

1 个答案:

答案 0 :(得分:0)

  1. 将它们列在一个列表中
  2. 如[A,B,C,D,M,N,B,X,M,F,B,M,A]

    1. 加权。
    2. M权重1后面的第一个字符,第二个字符串加权2,直到下一个M。

      1. 总结一下。
      2. 重量最轻的char获胜。 (这意味着你的一些关联。)