比方说,我有两个numpy数组,它们分别来自不同的数据源。
a = [[ 1.1 -0.1 0.1 -0.9 ]
[ 1.7 -0.2 0.1 -0.8]
...
[ 1.7 -0.3 0.7 -0.6 ]]
和
b = [[ 1.9 0.7 0.4 -0.8 ]
[ 1.8 0.1 0.1 -0.8 ]
...
[ 1.4 0.1 0.9 -0.8]]
每个形状为(1000,4)
。
但是我想结合这两个数据并通过指定不同的分类数据源来训练MLP model
。
那我该如何合并这些数据呢?
哪个encoding method
合适? One hot encoding
还是Integer encoding
?
我尝试使用Integer encoding
,但是由于它们的数据源没有任何关联,因此我认为我们不能使用Integer encoding
。
此外,由于One hot encoding
用于分类数据,因此我们也不能使用它们,因为原始数据不像分类数据。
由于我在模型中使用Keras,因此最好使用Keras API。