应用错误收集

我有一个顺序数据（即每次出现一个实例）。我想确定（一段时间后）累积的实例数量是随机的（即稀疏的）还是同类的（即存在一定的相关性）。

为此，我使用了顺序K均值。首先，给出两个聚类中心，然后将数据依次聚类为两个类。过了一会儿，如果我观察到两个群集之间的数据稀疏，那么我说这是随机的。但是，如果我观察到数据大部分都聚集在一个群集中（例如，数据的70％），那么我说数据是同质的。

我的想法正确吗？