我有一个数据集,其中每列都有一个对应于每一行的strut / array / integer。此外,每个单元中的结构或阵列具有不同的尺寸。任何人都可以指导我如何平整/结构化这些数据,以便我可以使用它来构建SVM模型或用作群集的输入数据。
这是数据如何的示例:
a_data b_data ........n_data
r1 7.162 [24×1] strut [6×2]double
r2 0.1945 [361×1] strut [40×2]double
.
.
.
rn
[24×1]结构就像
732338.705682870 0 'no'
732338.706597222 1 'yes'
732338.707777778 0 'maybe'
732339.525729167 0 'yes'
我不确定是否必须对此类数据进行标准化/规范化/二值化以及如何在此数据集上实现它。任何关于此的信息或处理类似数据的经验都将非常感激。