我必须实现两个交互模式算法(IPM和IPM2),我目前已经在我的第一个算法的中途。不幸的是,我是数据挖掘的新手,我不知道在我的算法中使用它们的适当数据结构。
第一种算法是从大型数据集中查找频繁模式,数据集来自(SPMF)网站。首先,我需要使用可扩展的数据结构,或者每次都必须处理更大的数据集。另一个问题是我必须创建矩阵A * A,(A =数据集的大小)然后挑战是将长度为2的模式放在索引矩阵[j] [j]中。是否可以将多个货币对放入一个指数?例如(3,2)是一个模式,我想将它存储在(矩阵[2] [2])中,如果模式是(4,29)我想将它存储到索引[29] [29] 。这样做的最佳数据结构是什么?我尝试了ArrayList和List,现在我正在创建一个矩阵,但它不合适。如果您能理解这个问题,我们将不胜感激。